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prOlogo 


Este libro es una continuation de mi Calculus, volumen I, segunda edition. 
El presente volumen fue escrito con el mismo plan fundamental que inspiro al 
primero. Un adecuado enfoque hacia la tecnica se combina con un riguroso 
desarrollo teorico. Se ha procurado hacer llegar al estudiante el espiritu de la 
matematica moderna sin exagerar el formalismo. Como en el volumen I, se han 
incluido comentarios de tipo histdrico para hacer vivir al lector la evolution de 
las ideas. 

El segundo volumen esta dividido en tres partes, tituladas: Analisis lineal, 
Analisis no lineal, y Temas especiales. Los dos ultimos capltulos del volumen I 
han sido repetidos y son los dos primeros capltulos del volumen II, de modo que 
toda la materia relativa al algebra lineal esta completa en cada volumen. 

La parte 1 contiene una introduction al algebra lineal, incluymdo transfor- 
maciones lineales, matrices, determinantes, autovalores y formas cuadraticas. 
Se dan aplicaciones al analisis, en particular al estudio de las ecuaciones diferen- 
ciales lineales. Se estudian los sistemas de ecuaciones diferenciales con la ayuda 
del calculo matricial. Se demuestran los teoremas de existencia y unicidad por 
medio del metodo de Picard de aproximaciones sucesivas, que tambien se trata 
utilizando los operadores de contraction. 

En la parte 2 se discute el calculo de funciones de varias variables. El calculo 
diferencial se unifica y simplifica con la ayuda del algebra lineal. Se incluyen 
reglas de la cadena para campos escalares y vectoriales, y aplicaciones a las 
ecuaciones diferenciales en derivadas parciales y a problemas de extremos. En 
calculo integral se incluyen integrales de linea, integrales multiples y de superficie, 
con aplicaciones al analisis vectorial. En esto la exposition sigue mas o menos la 
linea clasica y no incluye un desarrollo formal de las formas diferenciales. 

Los temas especiales tratados en la parte 3 son Probabilidades y Analisis 
numerico. El de probabilidades esta dividido en dos capltulos, uno que trata de 
los espacios muestrales finitos o infinitos numerables; el otro de espacios mues- 
trales no numerables, variables aleatorias, y funciones de distribution. Las apli¬ 
caciones se ilustran en el estudio de variables aleatorias uni- y bi-dimensionales. 

El ultimo capitulo contiene una introduction al analisis numerico, poniendo 
especial atencion en los distintos tipos de polinomios de aproximacidn. Termina 
el libro con un estudio de las formulas de integration aproximada, tales como la 
regia de Simpson y una discusion de la formula de sumacion de Euler. 


VII 



VIII 


Prdlogo 


En este volumen hay materia suficiente para un curso anual completo con 
tres o cuatro sesiones semanales. Presupone un conocimiento del calculo con urn 
variable como se desarrolla en la mayorla de los cursos del primer ano de calculo. 
El autor ha imaginado el curso con cuatro sesiones semanales, dos de exposicion 
por parte del profesor y dos para preguntar a los alumnos, empleando aproxima- 
damente diez semanas en cada parte y omitiendo las secciones sehaladas con 
asterisco. 

Este segundo volumen ha sido planeado de modo que muchos capitulos 
pueden omitirse en cursos abreviados. Por ejemplo, el ultimo capitulo de cada 
parte puede suprimirse sin romper la continuidad de la exposicion. La parte 
primera proporciona material para un curso combinado de algebra lineal y de 
ecuaciones diferenciales ordinarias. Cada profesor puede elegir los temas adecua- 
dos a sus necesidades y preferencias consultando el diagrama de la pagina si- 
guiente que muestra la interdependencia Idgica de los capitulos. 

Una vez mas reconozco con agrado el asesoramiento de numerosos amigos y 
colegas. Al preparar la segunda edicion recibi valiosa ayuda de los profesores 
Herbert S. Zuckerman de la Universidad de Washington, y Basil Gordon de la 
Universidad de California, Los Angeles, cada uno de los cuales sugirio varias 
mejoras. Agradezco tambien al personal de la Blaisdell Publishing Company su 
cooperacion y ayuda. 

Como en otras ocasiones me da especial satisfaccion expresar mi gratitud 
a mi esposa por su valiosa y variada contribucidn. En reconocimiento le dedico 
gustosamente este libro. 


Pasadena, California 


T. M. A. 
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ESPACIOS LINEALES 


1.1 Introduccion 

A lo largo de la Matemdtica se encuentran muchos ejemplos de objetos mate- 
maticos que pueden sumarse unos con otros y multiplicarse por numeros reales. 
Ante todo, los numeros reales son objetos de tal natmaleza. Otros ejemplos son 
las funciones vectoriales, los numeros complejos, las series y los vectores en el 
espacio n-dimensional. En este capitulo tratamos un concepto matematico general, 
llamado espacio lineal, que incluye todos esos ejemplos y muchos otros como 
casos particulares. 

Brevemente, un espacio lineal es un conjunto de elementos de naturaleza 
cualquiera sobre el que pueden realizarse ciertas operaciones llamadas adicidn y 
multiplicacion por numeros. A1 definir un espacio lineal no especificamos la 
naturaleza de los elementos ni decimos como se realizan las operaciones entre 
ellos. En cambio, exigimos que las operaciones tengan ciertas propiedades que 
tomamos como axiomas de un espacio lineal. Vamos ahora a hacer con detalle una 
descripcion de esos axiomas. 


1.2 Definicion de espacio lineal 

Sea V un conjunto no vacio de objetos, llamados elementos. El conjunto V 
se llama espacio lineal si satisface los diez axiomas siguientes que se enuocian 
en tres grupos. 

Axiomas de clausura 

axioma 1. clausura respecto de la adici6n. A todo par ae elementos 
Key de V corresponde un elemento unico de V llamado suma de x e y, designado 
por x + y. 


3 
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AXIOMA 2. CLAUSURA RESPECTO DE LA MULTIPLICACION POR NUMEROS REA¬ 
LES. A todo x de V y todo numero real a corresponde un elemento de V llamado 
producto de a por x, designado por ax. 

Axiomas para la adicidn 

AXIOMA 3. LEY conmutativa. Para todo x y todo y de V, tenemos 
x + y = y + x. 

axioma 4. ley asociativa. Cualesquiera que sean x, y, z de V, tenemos 
(x + y) + z = x + (y + z). 

axioma 5. existencia de elemento cero. Existe un elemento en V, de¬ 
signado con el simbolo O, tal que 

x + O = x para toao x de V: 

axioma 6. existencia de opuestos. Para todo x de V, el elemento ( — \)x 
tiene la propiedad 


x + (-l)x = O . 


Axiomas para la multiplicacidn por numeros 

AXIOMA 7. LEY asociativa. Para todo x de V y todo par de numeros 
reales a y b, tenemos 


a{bx) = (ab)x . 

axioma 8. ley distributiva para la adici6n en V. Para todo x y todo 
y de V y todo numero real a, tenemos 

a(x + y) = ax + ay . 

AXIOMA 9. LEY DISTRIBUTIVA PARA LA ADICI6N DE NUMEROS. Para todo 
x de V y todo par de numeros reales a y b, tenemos 

(a + b)x = ax + bx . 

axioma 10. existencia de elemento identico. Para todo x de V, tene- 
mos lx = x. 
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Los espacios lineales asi definidos, se llaman, a veces, espacios lineales reales 
para resaltar el hecho de que se multiplican los elementos de V por numeros 
reales. Si en los axiomas 2, 7, 8 y 9 se reemplaza numero real por numero com¬ 
plejo, la estructura que resulta se llama espacio lineal complejo. Algunas veces 
un espacio lineal se llama tambien espacio vectorial lineal o simplemente espacio 
vectorial; los numeros utilizados como multiplicadores se llaman escalares. Un 
espacio lineal real tiene numeros reales como escalares; un espacio lineal com¬ 
plejo tiene como escalares numeros complejos. Si bien consideraremos principal- 
mente ejemplos de espacios lineales reales, todos los teoremas son validos para 
espacios lineales complejos. Cuando digamos espacio lineal sin mas, se sobrenten- 
dera que el espacio puede ser real o complejo. 


1.3 Ejemplos de espacios lineales 

Si precisamos el conjunto V y decimos como se suman sus elementos y como 
se multiplican por numeros, obtenemos un ejemplo concreto de espacio lineal. 
El lector facilmente puede comprobar que cada uno de los ejemplos siguientes 
satisface todos los axiomas para un espacio lineal real. 

ejemplo 1. Sea V = R, el conjunto de todos los numeros reales, y sean 
x + y y ax la adicion y la multiplicacion ordinarias de numeros reales. 

ejemplo 2. Sea V = C el conjunto de todos los numeros complejos, defi- 
nimos x + y como la adicion ordinaria de numeros complejos, y ax como la mul¬ 
tiplicacion del numero complejo x por el numero real a. Aunque los elementos de 
V sean numeros complejos, este es un espacio lineal real porque los escalares 
son reales. 

ejemplo 3. Sea V = V„, el espacio vectorial de todas las n-plas de nume¬ 
ros reales, con la adicion y la multiplicacion por escalares definidas en la forma 
ordinaria en funcion de los componentes. 

ejemplo 4. Sea V el conjunto de todos los^vectores V„ ortogonales a un 
vector no nulo dado N. Si n = 2, este espacio lineal es una recta que pasa por O 

con N como vector normal. Si n = 3, es un piano que pasa por O con N como 

vector normal. 

Los siguientes ejemplos se llaman espacios funcionales. Los elementos de V 

son funciones vectoriales, con la suma de dos funciones / y g definidas en la 

forma ordinaria: 


(/+ g)0) =/(*) + g( x) 
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para todo real x en la intersection de los dominios de / y g. La multiplicacion de 
una funcion / por un escalar real a se define asi: af es aquella funcion cuyo valor 
en cada x del dominio de / es af(x). El elemento cero es la funcion cuyos valores 
son nulos para todo x. El lector puede comprobar facilmente que cada uno de 
los conjuntos siguientes es un espacio funcional. 

ejemplo 5. El conjunto de todas las funciones definidas en un intervalo 
dado. 

ejemplo 6. El conjunto de todos los polinomios. 

ejemplo 7. El conjunto de' todos los polinomios de grado < n, siendo n 
fijo. (Siempre que consideremos este conjunto, se sobrentendera que siempre esta 
incluido el polinomio nulo.) El conjunto de todos los polinomios de grado igual 
a n no es una espacio lineal porque no se satisfacen los axiomas de clausura. Por 
ejemplo, la suma de dos polinomios de grado n puede no ser de grado n. 

ejemplo 8. El conjunto de todas las funciones continuas en un intervalo 
dado. Si el intervalo es [a, b], designamos este espacio con C(a,b). 

ejemplo 9. El conjunto de todas las funciones derivables en un punto dado. 

ejemplo 10. El conjunto de todas las funciones integrables en un intervalo 
dado. 

ejemplo 11. El conjunto de todas las funciones / definidas en el punto 1 
siendo /(l) = 0. El numero 0 es esencial en este ejemplo. Si reemplazamos 0 por 
un numero no nulo c, violamos el axioma de clausura. 

ejemplo 12. El conjunto de todas las soluciones de una ecuacion diferencial 
lineal homogenea y" + a/ + by = 0, donde ay b son constantes dadas. Tambien 
aqui es esencial el 0. El conjunto de soluciones de una ecuacion diferencial no 
homogenea no satisface los axiomas de clausura. 

Estos ejemplos y muchos otros hacen patente como el concepto de espacio 
lineal esta extendido por el Algebra, la Geometria y el Analisis. Cuando se deduce 
un teorema de los axiomas de un espacio lineal, obtenemos un resultado vdlido 
para cada ejemplo concreto. Unificando varios ejemplos de este modo, consegui- 
mos un conocimiento mas profundo en cada uno. En ocasiones el conocimiento 
de un determinado ejemplo ayuda para anticipar o interpretar resultados vtiidos 
para otros ejemplos y pone en evidencia relaciones que de otro modo podrian 
pasiar inadvertidas. 
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1.4 Consecuencias elementales de los axiomas 

Los teoremas que siguen se deducen facilmente de los axiomas de un espacio 
lineal. 

teorema 1.1. unicidad del elemento cero. En cualquier espacio lineal 
existe un elemento cero y solo uno. 

Demostracion. El axioma 5 nos asegura que existe por lo menos un elemento 
cero. Supongamos que existan dos, sean O x y O 2 . Haciendo x = O x y O = 0 2 en 
el axioma 5, obtenemos O x + 0 2 = O x . Analogamente, haciendo x = 0 2 y 
O = O x , encontramos 0 2 + O x = 0 2 . Pero O x + 0 2 = 0 2 + 0 5 por la ley con- 
mutativa, asi que O x = 0 2 . 

teorema 1.2. unicidad de elementos opuestos. En cualquier espacio 
lineal todo elemento tiene exactamente un opuesto. Esto es, para todo x existe 
un y, y solo uno tal que x + y = O. 

Demostracion. El axioma 6 nos dice que cada x tiene por lo menos un 
opuesto, a saber ( — l)x. Supongamos que x tenga dos opuestos, sean y x e y 2 . En- 
tonces x + y x = O y x + y 2 = O. Sumando y 2 a los dos miembros de la primera 
igualdad y aplicando los axiomas 5, 4 y 3, obtenemos que 


y 


+ (X + yd - y * + o = y 2 , 


yz + (x + yd = (^2 + X ) + y x - O + Ji = y x + O = y 1 . 


Por consiguiente y, = y 2 , con lo que x tiene exactamente un opuesto, el elemen¬ 
to ( — l)x. 


Notacidn. El opuesto de x se designa por — x. La diferencia y — x se define 
como la suma y + ( — x). 

El teorema siguiente muestra un conjunto de propiedades que rigen los 
calculos algebraicos elementales en un espacio lineal. 

teorema 1.3. En un espacio lineal, designemos con x e y dos dementos 
cualesquiera y con a y b dos escalares cualesquic^. Tenemos entonces las pro¬ 
piedades siguientes: 

a) Ox = O. 
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c) (— a)x — — (ax) = a( — x). 

d) Si ax = O, entonces a = 0 o x = O, o los dos. 

e) Si ax = ay y a # 0 entonces x = y. 

f) Si ax — bx y x^O, entonces a = b. 

g) - (x + y) = ( - x) + ( - y) = - x - y. 

h) x + x = 2x, x+ x +x = 3x, y en general, 2f=i * = nx. 

DemostraremQs a), b) y c) y dejamos como ejercicios las demostraciones de las 
otras propiedades. 

Demostracion de a). Sea z = Ox. Deseamos demostrar que z = O. Su- 
mando z a si mismo y aplicando el axioma 9, encontramos que 

z + z = Ox + Ox = (0 + 0)x = Ox = z. 

Sumemos ahora — z a ambos miembros y obtenemos z — O. 

Demostracion de b). Sea z = aO, sumar z a si mismo, y aplicar el axioma 8. 

Demostracion de c). Sea z = (— a)x. Sumando z a ax y aplicando el axio¬ 
ma 9, encontramos que 

z + ax = (—a)x + ax = (—a + a)x = Ox = O , 

as! que z es el opuesto de ax, z — —(ax). Analogamente, si sumamos a(—x) a 
ax y aplicamos el axioma 8 y la propiedad b), encontramos que a(—x) — —(ax). 

1.5 Ejercicios 

En los ejercicios del 1 al 28, determinar si cada uno de los conjuntos dados es un 
espacio lineal real, si la adicion y multiplicacion por escalares reales esta definida en 
la forma usual. Para aquellos en los que no es asi, decir cuales son los axiomas que no se 
cumplen. Las funciones de los ejercicios 1 al 17 son reales. En los ejercicios 3, 4 y 5, cada 
funcion tiene un dominio que contiene 0 y 1. En los ejercicios 7 al 12, cada dominio con- 
tiene todos los numeros reales. 

1. Todas las funciones racionales. 

2. Todas las funciones racionales f/g, con el grado de / < que el grado de g (incluyen- 
do / = 0). 

3. Todas las / con /(0) = /(1). 

4. Todas las / con 2/(0) =/'( 1). 

5. Todas las / con /(1) = 1 + /(0). 

6. Todas las funciones escalonadas definidas en [0, 1], 

7. Todas las / en las que f(x)r£> 0 cuando x —» +oo. 

8. Todas las funciones pares. 

9. Todas las funciones impares. 
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10 . 

11 . 

12 . 

13. 

14. 

15. 

16. 

17. 

18. 

19. 

20 . 
21 . 
22 . 

23. 

24. 

25. 

26. 
27. 


28. 

29. 


30. 


31. 


32. 


Todas las funciones acotadas. 

Todas las funciones crecientes. 

Todas las funciones con periodo 2 u. 

Todas las / integrables en [0,1] con j*f(x)dx = 0. 

Todas las / integrables en [0,1] con S„ f(x)dx > 0. 

Todas las / que satisfacen f(x) = /(I — x) para todo x. 

Todos los polinomios de Taylor de grado ^ n para un n fijo (incluyendo el polino- 
mio cero). 

Todas las soluciones de una ecuacion diferencial lineal homogenea de segundo orden 
y" + P(x)y' + Q(x)y — 0, siendo P y Q funciones dadas, continuas para todo x. 

Todas las sucesiones reales acotadas. 

Todas las sucesiones reales convergentes. 

Todas las series reales convergentes. 

Todas las series reales absolutamente convergentes. 

Todos los vectores (x, y, z) de V, con z = 0. 

Todos los vectores (x, y, z) de V 3 con x = 0 o y = 0. 

Todos los vectores ( x, y, z) de V 3 con y = 5x. 

Todos los vectores (x, y, z) de V 3 con 3x -f 4y = 1, z = 0. 

Todos los vectores (x, y, z) de V g que son productos de (1, 2, 3) por escalares. 

Todos los vectores (x, y, z) de V 3 cuyos componentes satisfacen un sistema de tres ecua- 
ciones lineales de la forma 


a n x + a 12 y + a 13 z = 0 , a 21 x + a 22 y 4- a 23 z = 0 , a 31 x + a 32 y + a^z = 0 . 


Todos los vectores de V„ que son combinaciones lineales de dos vectores dados A y B. 
Sea V = R + , el conjunto de los numeros reales positivos. Definamos la «suma» de dos 
elementos x e y de V corao su producto x -y (en el sentido ordinario), y definamos la 
«multiplicacion» de un elemento x de V por un escalar c poniendo x c . Demostrar que 
V es un espacio lineal real con el elemento cero. 

a) Demostrar que el axioma 10 puede deducirse de los otros axiomas. 

b) Demostrar que el axioma 10 no puede deducirse de los otros axiomas si el axioma 
6 es reemplazado por el axioma 6': Para todo x de -V y todo y de V tenemos que 
x+y—O. 


Sea S el conjunto de todos los pares ordenados (x, , x 9 ) de numeros reales. En cada case 
determinar si S es o no un espacio lineal con las operaciones de adicion y multiplica- 
cion por escalares definidas como se indica. Si el conjunto no es un espacio lineal, 
indicar curies son los axiomas que no se cumplen. 

a) (*!, X 2 ) + (/!, y 2 ) = (x l +y!,x 2 + y 2 ), a(x 1 , x 2 ) = (a Xl , 0). 

b) (*i, x 2 ) + Or, y 2 ) = (*! + Ti > 0), a(x t , x 2 ) = (ax x , ax 2 ). 

c) (x x , x 2 ) + Or, y 2 ) = (xx, x 2 + y 2 ), a(x t , x 2 ) = (ax 1 , ax 2 ). 

d) (x x , x 2 ) + (y x ,y 2 ) = (|x x + x 2 |, \y l + y 2 1), a(x y , x 2 ) = (taxj, \ax 2 \). 

Demostrar las partes de la d) a la h) del teorema 1|.3. 


1.6 Subespacios de un espacio lineal 

Dado un espacio lineal V sea S un subconjunto no vacio de V. Si S es tam- 
bien un espacio lineal, entonces S se llama subespacio de V. El teorema que sigue 
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da un sencillo criterio para determinar si un subconjunto de un espacio lineal 
es o no un subespacio. 

teorema 1.4. Sea S un subconjunto no vacio de un espacio lineal V. 
Tal subconjunto S es un subespacio si y solo si satisface los axiomas de clausura. 

Demostracion. Si S es un subespacio, satisface todos los axiomas de un 
espacio lineal, y por tanto, en particular, los axiomas de clausura. 

Demostremos ahora que si S satisface los axiomas de clausura, satisface 
tambien los otros. Las leyes conmutativa y asociativa para la adicion (axiomas 
3 y 4) y los axiomas para la multiplicacion por escalares (axiomas del 7 al 10) 
se satisfacen automaticamente en S porque son validos para todos los elementos 
de V. Falta comprobar los axiomas 5 y 6, la existencia del elemento cero en S, 
y la existencia de un opuesto para cada elemento de S. 

Sea x un elemento cualquiera de S. (S tiene por lo menos un elemento ya que 
no es vacio.) Segun el axioma 2, ax esta en S para todo escalar a. Tomando a = 0, 
resulta que Ox esta en S. Pero Ox = O, en virtud del teorema 1.3 a), con lo 
cual O e S, y se satisface el axioma 5. Tomando a — — 1, vemos que ( — l)x 
esta en S. Pero x + ( — l)x = Oya que x y (— 1 )x estan ambos en V, asi que el 
axioma 6 se satisface en S. Por consiguiente S es un subespacio de V. 

definicion. Sea S un subconjunto no vacio de un espacio lineal V. Un 
elemento x de V de la forma 

* 

x = 2 c < x «> 

»=i 

en donde x,, . . ., x* pertenecen todos a S y c lt ..., c* son escalares, se denomina 
combinacion lineal de elementos de S. El conjunto- de todas las combinaciones 
lineales finitas de elementos de S satisface los axiomas de clausura y por tanto 
es un subespacio de V. Decimos de ese subespacio que esta generado por S, o 
tambien le llamamos la envolvente lineal de S, y lo designamos por L(S). Si S 
es vacio, definimos L(S ) como {O}, el conjunto consta sdlo del elemento cero. 

Conjuntos distintos pueden generar el mismo subespacio. Por ejemplo, el es¬ 
pacio V 2 esta generado por cada uno de los siguientes conjuntos de vectores: 
{ij}> { iJ . i + j}, {O, i, —i, j, —j, i + y'j-El espacio de todos los polinomios n pit) 
de grado ^ n esta generado por el conjunto de n -F 1 polinomios {1 ,t,f,...,t n }. 

~ Tambien esta generado por el conjunto {1, f/2, f 2 /3, ■ • • > /"/(» + 1)} y por 
{1,(1 + t), (1 + t) 2 ,..., (1 + 0"}. El espacio de todos los polinomios esta ge¬ 
nerado por el conjunto infinito de los polinomios {1, t, f ,... }. 

Al llegar aqui surgen de modo natural numerosas preguntas. Por ejemplo, 
6que espacios pueden generarse por un numero finito de elementos? Si un espacio 
esta generado por un numero finito de elementos, £cual es el menor numero de 
elementos necesarios? Para discutir estas cuestiones y otras con ellas relacionadas 
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introducimos los conceptos de dependencia, independencia, bases y dimension. 
Y'a en el volumen I encontramos esas ideas al estudiar el espacio vectorial V„ 
Ahora vamos a extenderlas a espacios lineales de tipo general. 


1.7 Conjuntos dependientes e independientes en un espacio lineal 

definici6n. Un conjunto S de elementos de un espacio lineal V se llama 
dependiente si existe un conjunto finito de elementos distintos de S, x lt .... Xk, 
y un correspondiente conjunto de escalares c lt ..., Ck, no todos cero, tales que 

k 

= O . 

i=i 

El conjunto S se llama independiente si no es dependiente. En tal caso, cuales- 
quiera que sean los elementos distintos x x , ..., Xk de S y los escalares c lf .... Ck, 

k 

2 C& = O implica — c 2 = • • = c k = 0 . 

i=i 

Si bien la dependencia y la independencia son propiedades de los conjuntos 
de elementos, podemos tambien aplicar esas denominaciones a los elementos 
mismos. Por ejemplo, los elementos de un conjunto independiente se llaman ele¬ 
mentos independientes. 

Si S es un conjunto finito, la definicion anterior esta de acuerdo con la dada 
en el Volumen I para el espacio V«. No obstante, la definicion dada aqui no esta 
restringida a conjuntos finitos. 

ejemplo 1. Si un subconjunto T de un conjunto S es dependiente, el mismo 
S es dependiente. Esto es ldgicamente equivalente a la afirmacion de que todo 
subconjunto de un conjunto independiente es independiente. 

ejemplo 2. Si un elemento de S es el producto de otro por un escalar, S 
es dependiente. 

f.iemplo 3. Si O 6 S. entonces S es dependiente 

ejemplo 4. El conjunto vacio es independiente. 

En el Volumen I fueron discutidos muchos ejemplos de conjuntos dependien¬ 
tes e independientes. Los ejemplos que a continuacion se comentan, ilustran esos 
conceptos en espacios funcionales. En cada caso el espacio lineal fundamental V 
es el conjunto de todas las funciones reales definidas en la recta real. 
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ejemplo 5. Sean «,(/) = cos 2 1, u 2 (t ) = sen 2 1, u 2 (t) — 1 para todo nume- 
ro real t. La identidad pitagorica prueba que «, + u 2 — « 3 = O, asi' que las tres 
funciones u u u 2 , u :t son dependientes. 

ejemplo 6. Sea Uk ( t ) = t k para k = 0, 1, 2, . .., y t real. El conjunto 
S = {u„, u u u 2i . . . } es independiente. Para demostrar esto, basta demostrar que 
para cada n los n + 1 polinomios . . . , son independientes. Una rela- 

cion de la forma J f = O significa que 


(1.1) 1^ = 0 

fc =0 

para todo real t. Cuando t = 0, encontramos que c 0 = 0. Repitiendo el proceso, 
encontramos que cada coeficiente Ck es cero. 

ejemplo 7. Si a u ..., a„ son numeros reales distintos, las n funciones 
exponenciales 

Wji(.y) = e aiX , . . . , u n (x ) = e n »- c 

son independientes. Podemos demostrar esto por induccion sobre n. El resultado 
es trivial cuando n = 1. Por consiguiente, supongamos que es valida para n — 1 
funciones exponenciales y consideremos los escalares c,, . .. , c„ tales que 

(1-2) 2c k e atX = 0. 

k-l 

Sea a M el mayor de los n numeros a,, ..., a„. Multiplicando ambos miembros de 

(1.2) por e~ a « x , obtenemos 

(1.3) 2c k e ia *- a * )x =0. 

k =-1 

Si k M, el numero ak — a M es negativo. Por consiguiente, cuando x -*■ + en 
la ecuacion (1.3), cada termino con k^M tiende a cero y encontramos que cu = 0. 
Suprimiendo el termino M-esimo de (1.2) y aplicando la hipotesis de induccion, 
encontramos que cada uno de los n — 1 restantes coeficientes Ck es cero. 

teorema 1.5. Sea S={xt,..., Xk} un conjunto independiente que consta 
de k elementos de un espacio lineal V y sea L(S) el subespacio generado por S. 
Entonces todo conjunto de k+\ elementos do T.(S) es dependiente. 
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Demostracion. La demostracion es por induction sobre k, numero de ele- 
mentos de S. Supongamos primero que k = 1. Entonces, por hipotesis, S contiene 
un solo elemento x, siendo i, / O puesto que S es independiente. Ahora tome- 
mos en L(S) dos elementos distintos y, e y 2 . Entonces, cada uno de estos elementos 
es un escalar multiplicado por Xi, sea y 1 —c^x 1 e y 2 =c 2 Xi, en donde y c 2 no 
son ambos cero. Multiplicando yi por c 2 e y 2 por c t y restando, obtenemos 

C 2}>1 - Ci >’ 2 = O . 

Por lo tanto y^ e y 2 son dependientes, quedando asi demostrado el teorema 
cuando k— 1. 

Supongamos ahora que el teorema es cierto para k— 1 y demostremos que 
tambien lo es para k. Tomemos un conjunto de k+l elementos en L(S), sea 
7’={y 1 , y a y/fc+i}. Queremos probar que T es dependiente. Puesto que cada 
elemento y, esta contenido en L(S), podemos escribir 

k 

(1.4) y i =2 a <> x j 

i=1 

para cada i=l,2,,...,A:+l. Examinemos todos los escalares a tl que multipli- 
can a Xi y, para ello, consideremos dos casos en la demostracion. 

CASO 1. aij^O para todo i= 1,2,. .., k+ 1. En este caso la suma (1.4) 
no incluye a x,, asi cada y t en T esta en la envolvente lineal del conjunto 
S'={x 2 ,.. ., Xk). Pero S' es independiente y contiene k— 1 elementos. Por induc¬ 
tion y para k— 1, el teorema es cierto, siendo por lo tanto, T dependiente. Esto 
demuestra el Caso 1. 

CASO 2. No son cero todos los escalares an. Suponemos que a n # 0. 
Tomando i=l en la ecuacion (1.4) y multiplicando los dos miembros por c;, 
siendo a—an/a „, obtenemos: 


k 

cji = a a x t +J,c i a lj x j . 

3 = 2 

Si de esta ecuacion restamos la (1.4), resulta: 

k 

- y t = 1( c i a u - a n)Xj, 

3 = 2 


para i = 2,..., k+ 1. Esta ecuacion expresa cada uno de los elementos c,yi —y f 
como una combination lineal de los k—1 elementos independientes x 2 ,...,Xk. 
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Por induccion.los k elementos Ciy 1 —yi deben ser dependientes. En consecuencia, 
para cualquier eleccion de escalares t 2 , , f*+ i, no todos cero, tenemos 

k +1 

2 t l (c i yi - y<) = 0, 

*=2 

y de aqui deducimos 

J n /jfc+i \ fc+i 

-2= °- 

\i=2 / 1=2 

Esta es una combinacion de y lf ..., y*+i, que representa el vector cero, de esta 
manera los elementos y lt ..., y* + i deben ser dependientes, completando asf la 
demostracion. 

1,8 Bases y dimension 

definicion. Un conjunto finito S de elementos de un espacio lineal V se 
llama base finita de V si S es independiente y genera V. El espacio V es de 
dimension finita si tiene una base finita. De otro modo, V es de infinitas dimen¬ 
sions. 

teorema 1.6. Sea V un espacio lineal de dimension finita. Entonces toda 
base finita de V tiene el mismo numero de elementos. 

Demostracion. Sean S y T dos bases finitas de V. Supongamos que S y T 
constan respectivamente de k y m elementos. Puesto que S es independiente y en- 
gendra V, el teorema 1.5 nos dice que todo conjunto de k + 1 elementos de V 
es dependiente. Por consiguiente, todo conjunto de mas de k elementos de V es 
dependiente. Ya que T es un conjunto independiente, debe ser m < k. El mismo 
razonamiento con S y T intercambiadas prueba que k < m. Por lo tanto k — m. 

definicion. Si un espacio lineal V tiene una base de n elementos, el en- 
tero n se llama dimension de V. Escribimos n = dim V. 

ejemplo 1. El espacio V n tiene dimension n. Una base es el conjunto de 
los n vectores coordenados unitarios. 

ejemplo 2. El espacio de todos los polinomios pit) de grado < n tiene 
dimensidn n + 1 . Una base es el conjunto de n + 1 polinomios {1 , t, t 2 , . . . , t" }. 
Todo polinomio de grado < n es una combinacion lineal de esos n + 1 poli¬ 
nomios. 

ejemplo 3. El espacio de las soluciones de la ecuacion diferencial 
y" — 2y' — 3y = 0 tiene dimension 2. Una base esta formada por las dos fun- 
ciones u,(*) = e~\ u 2 {x) = e u . Toda solucion es una combinacion lineal de 
esas dos. 
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ejemplo 4. El espacio de todos los polinomios p(t) es de infinitas dimen- 
siones. El conjunto infinito {1, /, f\ ... } genera este espacio y ningun conjunto 
finito de polinomios genera el espacio. 

teorema 1.7. Sea V un espacio lineal de dimension finita con dim V = n. 
Se tiene; 

a) Cualquier conjunto de elementos independiente de V es un subconjunto 
de una cierta base para V. 

b) Cualquier conjunto de n elementos indepehdientes es una base para V. 

Demostracion. Para demostrar (a), consideremos el conjunto independiente 
S — {x 1 ,... ,Xk} constituido por elementos en V. Si L(S) — V, entonces S es una 
base. Si no, entonces hay algun elemento y en V que no esta en L(S). Anadamos 
ese elemento a S y consideremos el nuevo conjunto S'= {*]., .. ., Xk, y }. Si en este 
conjunto dependiente multiplicamos sus elementos por escalares c 1 ,...,Ck+i 
siendo alguno diferente de cero, estableceremos que 

k 

2 CiXi + c k+1 y = O . 

i=i 

Pero Ck +i ¥= 0 puesto que x 1 , ,Xk son independientes. De aqui que podamos 
resolver esta ecuacion respecto a y llegando a la conclusidn que yeL(S), lo que 
contradice el supuesto de que y no pertenece a L(S). Por lo tanto el conjunto S' es 
independiente y contiene k +1 elementos. Si L(S')=V, entonces S' es una base y, 
siendo S un subconjunto de S', la parte (a) queda demostrada. Si S' no es una base, 
entonces podemos proceder con S' de igual manera que procedimos con S y consi- 
derar otro nuevo conjunto S" que contiene k + 2 elementos y es independiente. 
Si S" es una base, (a) queda demostrado. Si no, repetimos el proceso. Debemos 
llegar a una base despues de un numero finito de etapas, ya que de otra manera 
obtendriamos un conjunto independiente con n +1 elementos, contradiciendo el 
teorema (1.5). Por eso, la parte (a) del teorema (1.7) queda demostrada. 

Para demostrar la parte (b) consideremos un conjunto independiente S con 
n elementos. Por la parte (a), S es un subconjunto de base B. Pero por el teore¬ 
ma 1.6, la base B tiene exactamente n elementos, por tanto, S=B. 

1.9 Componentes 

Sea V un espacio lineal de dimension n y consideremos una base cuyos 
elementos e,, ..., e„ se toman en un cierto orden. Una tal base ordenada la con- 
sideramos como una n-pla (e,, .... e„). Si xeV, podemos expresar x como una 
combinacion lineal de esos elementos base: 

n 

x = 2 c i e i ■ 

i =1 


( 15 ) 



16 ; 


Espacios lineales 


Los coeficientes en esta ecuacion determinan una n-pla de numeros (c,, . . ., c „) 
que esta univocamente determinada por x. En efecto, si tenemos otra represen¬ 
tation de x como combinacion lineal de e,, e,„ por ejemplox =2f=i dt e i > 

restando de ( 1 ,5) encontramos que 2”=i( c » ~ d^e t — O. Pero ya que los ele- 
mentos base son independientes, eso implica que c, = di para cada i, con lo cual 

(Cj, . . . , Cm) — (dj, . . . ,dn)' 

Los componentes de la n-pla ordenada (c,, .... c„) determinada por (1.5) 
se llaman componentes de x respecto a la base ordenada (e u ... , e„). 


1.10 Ejercicios 

En cada uno de los ejercicios del 1 al 10, S es el conjunto de todos los vectores 


(x , y, z) de V 3 cuyos componentes satisfacen 
un subespacio de V r Si lo es, calcular dim 

1. x = 0. 

2. x + y = 0. 

3. x + y + z = 0. 

4. x — y. 

5. x = y = z. 


la condicion que se da. Determinar si S es 

6. x = y o x = z. 

7. x 2 - y 2 = 0. 

8. x +y = 1. 

9. y = 2x y z = 3x. 

10. x + y + z = 0 y x — y — z = 0. 


Sea P„ el espacio lineal de todos los polinomios de grado < n, siendo n ftjo. En cada 
ejercicio del 11 al 20, sea S el conjunto de todos los polinomios / de P„ que satisfacen la 
condicion dada. Determinar si S es un subespacio de P„. Si lo es, calcular dim S 
11 . /( 0 ) = 0 . 

12. /'(0) = 0. 

13. /"(0) = 0. 

14. /(0) + /'(0) = 0. 

15. /(0) = /(t). 

16. /(0) = /(2). 

17. / es par. 

18. / es impar. 

19. / es de grado ^ k, siendo k < n, o / = 0. 

20. / es de grado k, siendo k < n, o f = 0. 

21. En el espacio lineal de todos los polinomios reales pit), describir el subespacio engen- 
drado por cada uno de los siguientes conjuntos de polinomios y determinar su dimension. 

a) {1, f 2 , r 4 }; b) {i t , / 3 , z 5 }; c) {/, z 2 }; d) {1 + /, (1 + /) 2 }. 

22. En este ejercicio, L(S ) es el subespacio generado por un subconjunto S de un espacio 
lineal V. Demostrar las proposiciones de la a) a la f) 

a) S £ L(S). 

b) Si S £ pc V y si T es un subespacio de V, entonces L(S) c j. Esta propiedad se 
expresa diciendo que L(S) es el menor subespacio de V que contiene S. 

c) Un subconjunto S de V es un subespacio de V si y solo si L(S) = S. 

d) Si S £ J £ V, entonces L(S) c LIT). 

e) Si S y T son subespacios de V, tambien lo es S n T. 

/) Si S y T son subconjuntos de V. entonces L(S n T) £Z.(5) rt L(T). 
g) Dar un ejemplo en e) que L(S nr)# L(S) n L(T). 

23. Sea V el espacio lineal de todas las funciones reales definidas en la recta real. Deter¬ 
minar si cada uno de los siguientes subconjuntos de V es dependiente o independiente. 
Calcular la dimension del subespacio generado por cada conjunto. 
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a) {1, e ax , e ix ), a ^ b. 

b) {e ax , xe ax }. 


f) {cos x, sen x}. 

g) {cos 2 x, sen 2 x}. 


c) {1, e ax , xe“*}. h) {1, cos 2x,sen 2 x}. 

d) {e ax , xe ax , x 2 e ax }. i) (senx, sen 2x}. 

e) { e x , e~ x , cosh x). j) {e x cos x, e~ x sen x}. 

24. Sean V un espacio lineal de dimension finita, y S un subespacio de V. Demostrar cada 
una de las proposiciones siguientes. 

a) S es de dimension finita y dim S < dim V. 

b) dim S = dim V si y solo si S = V. 

c) Toda base de S es parte de una base de V. 

d) Una base de V no contiene necesariamente una base de S. 


1.11 Productos interiores, espacios euclideos. Normas 

En la Geometria euclidea ordinaria, aquellas propiedades que cuentan con 
la posibilidad de medir longitudes de segmentos rectilineos y angulos formados por 
rectas se daman propiedades metricas. En nuestro estudio de V„, defmimos las 
longitudes y los angulos en funcion del producto escalar. Queremos ahora exten¬ 
der esas ideas a espacios lineale? mas generales. Primero introduciremos una ge- 
neralizacion del producto escalar, que llamaremos producto interior, y luego 
definiremos la longitud y el angulo en funcion de este producto interior. 

El producto escalar x • y de dos vectores x — (x^ ..., x«) e y = (yb, ... y„) 
de V n se definio en el Volumen I por la formula 

(!- 6 ) x ■ y = ^ x f y,- • 

i =1 

En un espacio lineal general, escribimos (x, y) en lugar de x • y para los productos 
interiores, y definimos el producto axiomaticamente y no mediante una formula. 
Esto es, establecemos unas ciertas propiedades que queremos que satisfagan los 
productos interiores y las consideramos como axiomas. 


definicion. Un espacio lineal real V tiene un producto interior si a cada 
par de elementos x e y de V corresponde un numero real iinico (x, y) que satis- 
face los siguientes axiomas cualesquiera que sean x, y, z de V y para todos los 
escalares reales c. 

(conmutatividad, o simetria). 
(distributividad, o linealidad). 
(asociatividad, u homogeneidad). 

( positividad ). 


1) (x, y) = (y, x) 

2) (x,y + z) = (x, y) + (x, z) 

3) c(x, j) = (cx, y) 

4) (x, x) > 0 si x ^ O 


Un espacio lineal con un producto interior se llama espacio real euclideo. 
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Observation: Haciendo c — 0 en (3), encontramos que (O, y) = 0 para todo y. 

En un espacio lineal complejo, un producto interior (x, y ) es un numero 
complejo que satisface los mismos axiomas que los del producto interior real, 
excepto el de la simetria que se reemplaza por la relacion 


(1') (x, y) — (y, x ), ( Sitnetria hermitianaf) 

siendo (>’, x) el complejo conjugado de (y, x). En el axioma de homogeneidad, el 
multiplicador escalar c puede ser cualquier numero complejo. Del axioma de la 
homogeneidad y (I'), llegamos a la relacion 


(3') (x, cy) = {cy, x ) = c(y, x ) = c(x,y). 

Un espacio lineal complejo con un producto interior se llama espacio euclideo 
complejo. (A veces se usa tambien la denomination de espacio unitario.) Un 
ejemplo es el espacio vectorial complejo V n (C) brevemente discutido en la sec- 
cion 12.16 del Volumen I. 

Aunque nos interesan principalmente los ejemplos de espacios euclideos rea¬ 
les, los teoremas de este capitulo son validos para espacios euclideos complejos. 
Cuando decimos espacio euclideo, sin mas, entenderemos que puede ser real o 
complejo. 

El lector debiera comprobar que cada ejemplo que sigue satisface todos los 
axiomas del producto interior. 

ejemplo 1. En V„ sea (x, y) = x ■ y, el producto escalar ordinario de x e y. 

ejemplo 2. Si x = (x, , x 2 ) e y = (y t ,y 2 ) son dos vectores de V 2 , defini- 
mos (x, y) mediante la formula 


(x, y) = 2xj+ x x y 2 + x 2 y x + x 2 y 2 . 


Este ejemplo pone de manifiesto que pueden existir mas de un producto interior 
en un espacio lineal dado. 

ejemplo 3. Sea C(a, b) el espacio lineal de todas las funciones reales con- 


t En honor de Charles Hermite (1822-1901) matematico frances que contribuyo mucho 
al desarrollo del algebra y del analisis. 
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tinuas en un intervalo [a, b]. Definamos un producto interior de dos funciones 
/ y g con la formula 


(/» g) =/V(0g(0 dt. 

Esta formula es analoga a la ecuacion (1.6). que define el producto escalar de dos 
vectores en V„. Los valores de las funciones f(t) y g(t) desempenan el papel de 
los componentes x,- e y u y la integracion el de la suma. 

ejemplo 4. En el espacio C(a, b), definimos 

(/. g)=J Mt)f{t)g(t) dt, 

J a 

donde w es una funcion positiva fija de C(a, h). Tal funcion se llama funcion peso. 
En el ejemplo 3 tenemos w(t) = 1 para todo t. 

ejemplo 5. En el espacio lineal de todos los polinomios reales, definimos 

(f,g) = jV ( /(/)g(0 dt. 

J 0 

Debido al factor exponencial, esta integral impropia converge para todo par de 
polinomios / y g. 

teorema 1.8. En un espacio eucltdeo V, todo producto interior satisface 
la desigualdad de Cauchy-Schwarz : 

\( x < }’)\ 2 < ( x > x )(y, y) para todo x y ftodo yenV. 

Ademas, el signo de igualdad es valido si y solo si x e y son dependientes. 

Demostracidn. Si ocurre que o bien x=0 o y=0 la demostracion es 
trivial. Supongamos que reyno son ambas cero. Sea z=ax+by en donde ay b 
son escalares que especificaremos despues. Tenemos la desigualdad (z,z) — 0 para 
todo a y b. Cuando expresamos esta desigualdad en funcion de x e y con una 
eleccion apropiada de a y b, obtenemos la desigualdad de Cauchy-Schwarz. 

Para expresar (z,z) en funcion de x e y usaremos las propiedades (1'). (2) 
y (3'). obteniendo 

(z, z) = (ax + by, ax + by) = (ax, ax) 4- (ax, by) + (by, ax) + (by, by) 

= aa(x, x) + ab(x, y) + ba(y, x) + bb(y, y) > 0. 
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Tomando a=(y,y) y suprimiendo en la desigualdad el factor positivo (y,y), 
resulta 

0, y)(x, x) + b(x, y) + b(y, x) + bb ^ 0. 

Ahora, hagamos b=—(x, y). Entonces, b — — (yjc) y la ultima desigualdad, 
ana vez simplificada, toma la forma 

( y,y)(x, x) ^ ( x,y){y , x) = |(x,;>)| 2 - 

Esto demuestra la desigualdad de Cauchy-Schwarz. El signo de igualdad es valido 
si y solo si z=0. Esto ocurre si y solo si x e y son dependientes. 


ejemplo. Aplicando el teorema 1.8 al espacio C(a, b) con el producto 
interior (/, g) = J* f(t)g(t) dt, encontramos que la desigualdad de Cauchy-Schwarz 
se transforma en 


(j’Vcogw dtf< (J7 2 (o dt)(j b a g \t > dt). 

El producto interior puede utilizarse para introducir el concepto metrico de 
longitud en cualquier espacio euclideo. 

definicion. En un espacio euclideo V, el numero no negativo ||x|| definido 
por la ecuacion 


11*11 = ( X , X) 1 / 2 


se denomina norma del elemento x. 

Cuando la desigualdad de Cauchy-Schwarz se expresa en funcion de las nor- 
mas, toma la forma 


\(x,y)\ < Ml IW!. 

Puesto que es posible definir un producto interior de muchas maneras, la 
norma de un elemento dependera del producto interior elegido. Esta falta de uni- 
cidad era de esperar. Este hecho es analogo al de que podemos asignar numeros 
distintos a la medida de la longitud de un segmento rectilineo dado, segun la 
eleccion de escala o unidad de medida. El teorema que sigue da las propiedades 
fundamentales de las normas que no dependen de la eleccion de producto interior. 
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teorema 1.9. En un espacio euclideo, toda norma tiene las propiedades 
siguientes para todos los elementos x e y, y todos los escalares c: 

a) || a: || =0 si x=0. 

b) ||x|| > 0 si x O (positividad). 

c) IIex|| = kl ||x|| ( homogeneidad ). 

d) IIx + y|| < ||x|| + ||y|| ( desigualdad triangular). 

El signo de igualdad es valido en la desigualdad triangular si y solo si x e y son 
dependientes. 

Demostracion. Las propiedades a), b) y c) se deducen inmediatamente de 
los axiomas del producto interior. Para demostrar d) observemos que 

II* + yll 2 = (* + y, * + y) = (*, *) + (y,y) + (*./> + (y, x) = 

= ll*ll 2 + llyll 2 + (*.j) + (xTy) ■ 

La suma (x, y) + (x, y) es real. La desigualdad de Cauchy-Schwarz prueba que 
|(x,y)| < ||*|| llyll y que |(x,j)| < ||x|| ||y||, asi que tenemos 

II* + yV < l|x|| 2 + ||y|| 2 + 2||x|| ||y|| = (||x|| + ||y||) 2 . 

Esto demuestra d). El signo de igualdad en d) es valido siempre que lo sea en la 
desigualdad de Cauchy-Schwarz. Cuando y = cx, siendo c > 0, tenemos 

llx +yll = llx + cx|| = (1 + c) ||x|| = llxll + IMI = ||x|| + llyll. 


definicion. En un espacio euclideo real V, el angulo formado por dos ele¬ 
mentos no nulos x e y se define como el numero 6 del intervalo 0 < 0 < v que 
satisface la ecuacion 


(1.7) 


cos 6 = 


(*, y) 

llxll llyll ' 


Observacion: La desigualdad de Cauchy-Schwarz prueba que el cociente del se- 
gundo miembro de (1.7) esta en el intervalo [ — 1,1], asi que existe solo un 6 en 
[0,^] cuyo coseno es igual al de este cociente. 


1.12 Ortogonalidad en un espacio euclideo 

definicion. En un espacio euclideo V, dos elementos x e y se llaman orto- 
gonales si su producto interior es cero. Un subconjunto S de V es un conjunto 
ortogonal si (x, y) = 0 para todo par de elementos distintos x e y de S. Un con- 
junto ortogonal se llama ortonormal si cada uno de sus elementos tiene norma 1. 
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El elemento cero es ortogonal a todo elemento de V; es el unico elemento 
ortogonal a si mismo. El siguiente teorema demuestra una relacion entre ortogona- 
lidad y dependencia. 

teorema 1.10. En un espacio euclideo V, todo conjunto ortogonal de 
elementos no nulos es independiente. En particular, en un espacio euclideo de 
distension finita con dim V — n, todo conjunto ortogonal que conste de n ele¬ 
mentos no nulos es una base para V. 

Demostracidn. Sea S un conjunto ortogonal de elementos no nulos de V, 
y supongamos que una cierta combinacion lineal finita de elementos de S es cero, 
sea 


* 


2 c i x i 


= o. 


donde cada x { e 5. Formando el producto escalar de cada miembro por x, y 
teniendo en cuenta que (x, ,xi) = 0 si i# 1, encontramos que c,(x, , x,) = 0. 
Pero (x, , Xi) # 0 ya que x, ¥= O con lo cual c, = 0. Repitiendo el razonamiento 
cambiando x, por x ; , encontramos que cada c, = 0. Esto prueba que S es indepen¬ 
diente. Si dim V — n y si S consta de n elementos, el teorema 1,7 b) demuestra 
que S es una base para V. 

ejemplo. En el espacio lineal real C(0, 2 ir ) con el producto interior 
(/,g) = $l*f(x)g(x)dx, sea S el conjunto de las funciones trigonometricas {u 0 , 
« 1( u 2 , ... } dadas por 

w 0 (x) = 1, « 2 „_i(x) = cos nx, w 2 „(x) =sen nx , para n — 1, 2. 

Si m¥= n, tenemos las relaciones de ortogonalidad 


J "2jt 

0 «nW“mW dx = 0 , 

asf que S es un conjunto ortogonal. Puesto que ningun elemento de S es el ele¬ 
mento cero, S es independiente. La norma de cada elemento de S se calcula facil- 
mente. Tenemos ( u 0 , u„) = dx = 2 ir y, para « > 1, tenemos 


(«i 


f 2y 9 f2tr 

n— 1» ^2n—l) I COS nX d,X 7T , (^2n» ^2«) = | S6H UX dx = 77". 

J 0 Jq 
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Por consiguiente, ||u 0 || = Vlir y ||«„|| = Vw para n > 1. Dividiendo cada u„ por 
su norma, obtenemos un conjunto ortonormal {%,<pi,cp 2 , ... } donde <p n =u n /\\u„\\. 
Asi pues, tenemos 


<Po(x) = 


1 

V277■’ 


fin- 1 (*) = 


cos nx 


<P2n(x) 


sen nx 

V^r 


para n ^ 1. 


En la seccion 1.14 demostraremos que todo espacio euclideo de dimension 
fjnita tiene una base ortogonal. El teorema que sigue muestra como se calculan 
los componentes de un elemento relativos a una tal base. 


teorema 1.11. Sea V un espacio euclideo de dimension finita n, y supon- 
gamos que S = {e,, . .., e» } es una base ortogonal para V. Si un elemento x esta 
expresado como una combinacidn lineal de los elementos de la base, sea esta 

0- 8 ) x = 2 c < e i> 

i=i 


entonces sus componentes relativos a la base ordenada {e lt ..., e„) vienen dados 
por las fdrmulas 

(1.9) C) ' = <>~^7) Para j = 1,2,...,n. 

En particular, si S es una base ortonormal, cada Cj viene dada por 

(1.10) c, = (x, e,). 

Demostracidn. Formando el producto interior de cada miembro de (1,8) 
con e„ obtenemos 


(x, e,) = 2 c i {e i , e,) = Cj {e } , e,) 

i — 1 

puesto que (e f , e,) = 0 si i¥= /'. Esto implica (1.9), y cuando (e,, e,) = 1, obte¬ 
nemos (1.10). 

Si {e u ..., e n } es una base ortonormal, la ecuacidn (1.9) puede escribirse 
en la forma 


n 

X = 2 ( x > e i) e i ■ 


1=1 


( 1 . 11 ) 
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El siguiente teorema prueba que en un espacio eucli'deo real de dimension 
finita con una base ortonormal el producto interior de dos elementos es igual a la 
suma de los productos de sus componentes. 

teorema 1.12. Sea V un espacio euclideo real de dimension finita n, 
y supongamos que {e u ..., e„} es una base ortonormal para V. Para todo par de 
elementos x e y de V, tenemos 

n _ 

(1.12) (x, y) — 2 (x, e,){y, ej (Formula de Parseval). 

>•=i 

En particular, cuando x = y, tenemos 

(1-13) M 2 = 2l(x, e< )| 2 . 

1=1 

Demostracion. Formando. el producto interior de ambos miembros de la 
ecuacion (1 11) con y, y aplicando la propiedad de linealidad del producto inte¬ 
rior, obtenemos (1.12). Cuando x = y, la ecuacion (1.12) se reduce a (1.13). 

Observacidn: La ecuacidn (1.12) se denomina como se indica en honor de 
M. A. Parseval (aproximadamente 1776-1836) , que obtuvo este tipo de formula en un 
espacio funcional especial. La ecuacion (1.13) es una generalizacion del teorema de 
Pitagoras. 


1.13 Ejercicios 


1. Sean x = (x v ... ,x„) e y = (y,,..., y„) vectores arbitrarios de V„. Determinar en cada 
caso, si (x, y) es un producto interior en V„, si (x, y) esta definido por la formula que se 
da. En el caso en que (x, y) no sea un producto interior, decir cuales son los axiomas 
que no se satisfacen. 

n 

a) (x, }•) =2*i W- 
1=1 
n 

• 

7=1 

c) (x,y) . 

i =1 i =1 

2. Supongamos que mantenemos los tres primeros axiomas del producto interior real 
(simetria, linealidad y homogeneidad) pero reemplazamos el cuarto axioma por uno nue- 
vo (4'): (x,x) = 0 si y sdlo si x = O. Demostrar que o {x, x) > 0 para todo x ^ O 
o bien (x, x) < 0 para todo x ^ O. 


b) (x,y) = 


/ JL \t/2 

d) (x,y) = ( 2 xfv? ) • 

e) (x, y) = 2 (x« + yd 2 - 2 *< ~ 2 y\ ■ 
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[Indication- Suponer (x, x) > 0 para un cierto x ^ O y (y, y) < 0 para un cierto 
y 5 * O. En el espacio generado por {x, y}, hallar un elemento z ^ O con (z, z) = 0.] 


Demostrar que en los ejercicios del 3 al 7 cada una de las proposiciones es valida para 
todo par de elementos x e y de un espacio euclideo real. 

3. (x,y) =0 si y solo si \\x + y |j = ]|x -_y||. 

4. (x, y) = 0 si y sdlo si \\x + y\\ 2 = ||xjj 2 + |i_y|| 2 . 

5. (x,y) =0 si y solo si ||x + cy [| > ||x|| para todo c real 

6. (x 4- y, x - y)= 0 si y solo si ||x|] = |]y||. 

7. Si x e y son elementos no nulos que forman un angulo 6, entonces 

llx - y || 2 = ||x|i 2 + ||_y|| 2 - 2 |[xl| ||j|| cos 6 . 

8. En el espacio lineal real C( \,e), definimos un producto interior por 

( fg) (log x)fix)g(x) dx . 

a) Si f[x) = Vx, calcular ||/||. 

b) Hallar un polinomio de primer grado g(x) = a + bx que sea ortogonal a la funcion 
constante fix) = 1. 

9. En el espacio lineal real C( —1, 1), sea (/, g) =Ji x f{t)g[t)dt. Considerar las tres fun- 
ciones u,, u 2 u 3 dadas por 

iq(f) = 1 , u 2 il) = t , u 3 (t) = 1 + t . 

Demostrar que dos de ellas son ortogonales, dos forman entre si un angulo 7r/3, y dos 
forman entre si un angulo ir/b. 

10. En el espacio lineal P„ de todos los polinomios reales de grado < n, definimos 




Jc= 0 


a) Demostrar que if, g) es un producto interior para P„. 

b) Calcular if, g) cuando fit) = t y g(f) — at + b. 

c) Si fit) = (, hallar todos los polinomios g ortogonales a f. 

11. En el espacio lineal de todos los polinomios reales, definimos (/, g) = J ( f e ^fitfgit) dt. 

a) Demostrar que esa integral impropia converge absolutamente para todos los polino¬ 
mios / y g. 

b) Si x„[t) = t * para n = 0, 1, 2, ..., demostrar que (x„, x m ) = (m + «)! . 

c) Calcular if, g) cuando fit) = 0 + 1)2 y g (/) _ t 2 + 

d) Hallar! todos los polinomios de primer grado git) = a + bt ortogonales a f(t) — l+t. 

12. En el espacio lineal de todos los polinomios reales, determinar si (/, g) es o no ur. 
producto interior cuando se define if, g) con la formula que se da. En el caso en que 
if, g) no es un producto interior, indicar que axiomas no son respetados. En c), /' y 
g' indican derivadas. 
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a) (fg) -/OKrO). c) (/.<?) =| 0 l /W(') <*• 

b) <J,g) = | [V('W * |- d) (/ I<? ) = (£/« dt)(\y t ) dt ). 

13. V esta formado con todas las sucesiones indefmidas de numeros reales {*„} para los 
cuales las series *^ convergen. Si x = {x„} e y = {y„} son dos elementos de V, 
definimos 

(*»y) = |^ n . 

t»=i 

a) Demostrar que esta serie converge absolutamente. 

[ Indication: Usar la desigualdad de Cauchy-Schwarz para aproximar la suma 

iw»u! 

b) Demostrar que V es un espacio lineal con ( x, y) como producto interior. 

c) Calcular (*, y) six, = l/n e y„ = l/(n + 1) para n > 1. 

d) Calcular (x,y) si x„ = 2" e y„ =1 /n\ para n > 1. 

14. Sea V el conjunto de todas las funciones reales / continuas en [0, +~) y tales que la 

integral e 'f 2 (t)dt converge. Definamos (/, g) = e~ t f(t)g(t)dt. 

a) Demostrar que la integral que da (/, g) converge absolutamente para cada par de 
funciones / y g de V. 

[ Indication: Aplicar la desigualdad de Cauchy-Schwarz para aproximar la inte¬ 
gral e~*\f(t)g(t)\dt.] 

b) Demostrar que V es un espacio lineal con (/, g) como producto interior. 

c) Calcular (/,g) si j(t) = e~* y g(f) =f n , donde n = 0, 1, 2, ... . 

15. En un espacio euclideo complejo, demostrar que el producto interior tiene las siguientes 
propiedades para todos los elementos x, y, z y todos los complejos a y b. 

a) (ax, by) = ah(x, y). b) (x, ay + bz) = a(x, y) + h(x, z). 

16. Demostrar que en todo espacio euclideo son validas las identidades siguientes. 

a) ||* + j||* = ||*ll* + ll/ll 2 + (*,/) + 0, *)• 

b) ||* +/||* - ||* -/||* = 2(*,/) + 2(/,*). 

c) II* +/||*+ ||*-/||* =2 ||*||*+ 2II/H*. 

17. Demostrar que el espacio de todas las funciones complejas continuas en un intervalo 
[a, b ] se transforma en un espacio unitario si definimos un producto interior por la 
formula 

(f,g) =\y(t)f(t)g(i)dt, 

donde w es una funcidn positiva fija, continua en [a,b]. 


1.14 Construccion de conjuntos ortogonales. Metodo de Gram-Schmidt 

Todo espacio lineal de dimension finita tiene una base finita. Si el espacio es 
euclideo, podemos construir siempre una base ortogonal. Este resultado se dedu- 
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cir£ como consecuencia de un teorema cuya demostracion ensena a construir 
conjuntos ortogonales en cualquier espacio euclfdeo, de dimension finita o de 
infinitas dimensiones. La construccidn se llama metodo de Gram-Schmidt, en me- 
moria de J. P. Gram (1850-1916) y E. Schmidt (1845-1921). 

TEOREMA 1.13. TEOREMA DE ORTOGONALIZACI6n. Sea X„ X 2 , ... , UM SU- 
cesion finita o indefinida de elementos de un espacio euclideo V, y designemos 
con L(x u ..., Xk) el subespacio generado por los k primeros de esos elementos. 

Existe una sucesion correspondiente de elementos y u y 2 . de V que tiene las 

siguientes propiedades para cada entero k: 

a) El elemento yk es ortogonal a todo elemento del subespacio L(y lt . . . y*- a ). 

b) El subespacio generado por y 1( .... y * es el mismo que el generado 
por x u ..., x k : 


L(y x ,..., yk) — E(xi ,..., x k ) ■ 

c) La sucesion y u y 2 , ..., es unica, salvo fadores escalares. Esto es, si 
y[, y£,.. ., es otra sucesion de elementos de V que satisfacen las propiedades a) 
y b), entonces para cada k existe un escalar Ck tal que y' k — c k yk • 

Demostracidn. Construyamos los elementos y,, y 2 , ..., por induccion. Para 
iniciar el proceso, tomamos y, = JCj. Supongamos ahora que hemos construido 
yt» ...» yr de modo que a) y b) se satisfacen cuando k = r. Definamos y r +, me- 
diante la ecuacion 

T 

(1.14) y r+1 = x r+1 - 2 a.-y,-» 

»=1 

donde los escalares a,, .... a r tienen que determinarse. Para j < r, el producto 
interior de y r +, con y, viene dado por 

r 

Owi . y,) = (x f+ i , y 3 ) - 2 a,(yi , y,) = (x r+1 , y 3 ) - a 3 (y,, y 3 ) , 

1 <=1 

puesto que (y;, y,) = 0 si i # /. Si y^O, podemos hacer y r+1 ortogonal a y,- 
tomando 

(1-15) a ^r+i, y 3 ) 

(yj, yd 

Si y, = O, entonces y r+1 es ortogonal a y, para cualquier a / que se elija, en este 
caso elegimos a, = 0. Asi pues, el elemento y, +1 esta bien definido y es ortogonal 
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a cada uno de los anteriores elementos y,, ..., y r Por consiguiente, es ortogonal 
a todo elemento del subespacio 


L (yi , • • •, y r ) ■ 

Esto demuestra a) cuando k = r + 1. 

Para demostrar b) cuando k = r + 1 , tenemos que probar que 
Li.Vi > • • •, y r + 1 ) = Ux i, • • •, x r+1 ), dado que L(y l ,y r ) = L(x 1 , . . ., x r ). 
Los r primeros elementos y x . y r pertenecen a 

L(x i ,...,x r ) 

y por tanto estan en el subespacio mas amplio L(x 1 . x T+1 ). El nuevo elemen¬ 
to y r+l dado por (1.14) es una diferencia de dos elementos de L(x l . x r +i) 

as! que tambien esta en L(x 1 ,..., x r+1 ). Esto demuestra que 

L(y x ,..., y r+ 1 ) £ L(x j 9 ••• 9 ^ r+ i) • 

La ecuacion (1.14) prueba que x r+1 es la suma de dos elementos deL(y 1 ,..., _y r ! l ) 
con lo que un razonamiento analogo da la inclusion en el otro sentido: 

L{x x ,, x r+1 ) £ L(jj,. .., _y r+ i) ■ 

Esto demuestra b) cuando k = r + 1. Por lo tanto a) y b) han sido demostrados 
por induccion respecto de k. 

Finalmente demostramos c) por induccion respecto de k. El caso fc = 1 es 
trivial. Por consiguiente, supongamos que c) es cierto para k = r y consideremos 
el elemento y' T+1 . En virtud de b), este elemento pertenece a 

Uyi , ■ • •, J r+ l) , 


asi que podemos escribir 


r+1 

}'r ■ 1 ~ 2 — Z r -1 J r. 1 > 

z= 1 

donde z, e L(y lt ..., y r ). Queremos demostrar que z, — O. Por la propiedad 
a), y' r+1 y c r+1 y r+1 son ambos ortogonales a z,. Por consiguiente, su diferencia, z r , 
es ortogonal a z r . Dicho de otro modo, z r es ortogonal a si mismo, asf que 
z r = O. Esto completa la demostracion del teorema de ortogonalidad. 

En la construccion anterior, puede suceder que y r +i = O para algun r. Enton- 
ces (1 .14) prueba que x r+x es una combinacion lineal de y,, ..., y r , y por tanto 
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de x u .. ., x r , asi que los elementos x u .... x r +i son dependientes. En otras pa- 
labras, si los k primeros elementos x t ,..., x k son independientes, los elementos 
correspondientes y„ ..., y* son no nulos. En este caso los coeficientes a,- de (1.14) 
vienen dados por (1.15), y las formulas que definen y 1( ... ,y k se convierten en 


(1.16) y! = x 1: 


K (x r +i ,y<) r 
>Wl _ r+1 £ to,*) * 


r = 1, 2,. .., k 


Estas formulas constituyen el metodo de Gram-Schmidt para construir un conjunto 
ortogonal de elementos no nulos y u ..., y k que generan el mismo subespacio que 
el conjunto independiente dado x,, ... x k . En particular, si x lt ..., x k es una 
base para un espacio euclideo de dimension finita, entonces y,..... y* es una base 
ortogonal para el mismo espacio. Tambien podemos convertir esta en una base 
ortonormal normalizando cada uno de los elementos y it esto es, dividiendolo por 
su norma. Por consiguiente, como corolario del teorema 1.13 tenemos el si- 
guiente. 

teorema 1.14. Todo conjunto euclideo de dimension finita tiene una base 
ortonormal. 


Si x e y son elementos en un espacio euclideo, con y ¥= O, el elemento 

(x, y) 

(y, y) 



Ficura 1.1 El metodo de Gram-Schmidt en V r Vn conjunto ortogonal {y^, y 2 , y 3 } 
se construye a partir de un conjunto independiente {x v x 2 , x,}. 
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se llama la proyeccion de x sobre y. En el metodo de Gram-Schmidt (1.16), 
construimos el elemento y r+1 restando de x r+1 la proyeccion de x r+1 sobre cada 
uno de los anteriores elementos y,, ... , y r . La figura 1.1 representa la construc- 
cion geometrica en el espacio vectorial V 3 . 

ejemplo 1. En V 4 , hallar una base ortonormal para el subespacio generado 
por los tres vectores = (1, —1, 1, —1), x 2 = (5, 1, 1, 1,), y x 3 = (—3, —3, 
1, -3). 

Solution. Aplicando el metodo de Gram-Schmidt, encontramos 


Vi = = (L -1, L -1). 

y 2 = * 2 - = *■-* = (4, 2,0, 2), 

0>i. y i) 


y 3 = - 


(x 3 .yi) „ 

(yi,yi) 


~~y 3 = x 3 - yi + y 2 = (0, o, o, 0). 

(y 2 , y 2 ) 


Puesto que y 3 = O, los tres vectores x lt x 2 , x 3 deben ser dependientes. Pero ya 
que y! e y 2 son no nulos, los vectores x, y x 2 son independientes. Por consiguiente 
L(x iy x 2 , x 3 ) es un subespacio de dimension 2. El conjunto {y,, y 2 } es una base 
ortogonal para ese subespacio. Dividiendo y, e y 2 cada uno por su norma llegamos 
a una base ortonormal que consta de dos vectores 


11*11 


■ 1 , 1 , - 1 ) 


y 2 

11*11 


-^( 2 . 1 , 0 . 1 ) 


ejemplo 2. Polinomios de Legendre. En el espacio lineal de todos los po- 
linomios, con el producto interior (x, y) =Ji 1 x(/)y(f) dt, consideramos la sucesion 
indefinida x„, x u x 2 , .... donde x n (t) = t n . Cuando se aplica a esa sucesion el 
teorema de ortogonalizacion se transforma en otra sucesion de polinomios 
*, yi. y 2 . •••. que el matematico frances A. M. Legendre (1752-1833) fue el 
primero en encontrar en su trabajo sobre la teorfa del potencial. Los primeros de 
esos polinomios se calculan facilmente con el metodo de Gram-Schmidt. Ante 
todo, tenemos y 0 (t) = x„(t) = 1. Puesto que 

(y 0 , y 0 ) dt = 2 y ( Xl , y 0 ) = dt = 0 , 


encontramos que 


(*i, y 0 ) 
(y 0 , y<>) 


y o (0 = ^i(0 = t . 


yi(0 = ^i(0 
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A continuation, utilizamos las relaciones 


(*! 


"'“J ", 


t 2 dt=~. 






t 3 dt — 0 , (y 




t 2 dt 


para obtener 


^ 2 (0 = * 2 (0 - 


u \>, y 0 ) (y 1 , y 1 ) 3 


Del mismo modo, encontramos que 

a 6 


,3 3 


y 3 (t) = t 3 --t, 


10 


y 4(0 = - -1 2 + ft, yM = + 


35 


21 


En el capftulo 6 encontraremos de nuevo esos polinomios en el estudio de las 
ecuaciones diferenciales, y probaremos que 


y n { 0 = 


n! d n , i2 


(2n)! dr n 


— (0- l) n . 


Los polinomios P„ dados por 


PJt) 


(2 n)\ 
2 n (n !) 2 


y«( 0 = 


1 tf n 
2 "n! dt re 


(<* - If 


se conocen con el nombre de polinomios de Legendre. Los polinomios de la su- 

cesion ortonormal correspondiente <p 0 , <p x , f 2 .dados por q>„ — y„/||y„]| se 

llaman polinomios de Legendre normalizados. De las formulas para y 0 , ..., y 5 
dadas antes, encontramos que 


<Po(t) = 




n«) = (3 1 3 - 1) , cp 3 (t) = \Jl(5t 3 - 30 , 


<P i (t) = y?(35t i -30t i +3), 


<pa(t) — 'y (63t 5 — 70t 3 + 15t). 


1.15 Complementos ortogonales. Proyecciones 

Sean V un espacio euclfdeo y S un subespacio de dimension finita. Vamos 
a considerar el siguiente problema de aproximacion: Dado un elemento x de 
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V, determinar un elemento en S cuya distancia a x sea lo mas pequeha posible. 
La distancia entre dos elementos x e y se define como la norma \\x — y]\. 

Antes de discutir este problema en su forma general, consideremos un caso 
particular, representado en la figura 1.2. Aquf V es el espacio vectorial V :< y S es 
un subespacio de dimension dos, un piano que pasa por el origen. Dado x de V, 
el problema consiste en encontrar, en el piano S, el punto s mas proximo a x. 

Si x e S, evidentemente la solution es s = x. Si x no pertenece a S, el punto 
mas proximo s se obtiene trazando una perpendicular desde x al piano. Este sen- 
cillo ejemplo sugiere una introduction al problema general de aproximacion y da 
origen a la discusion que sigue. 

definicion. Sea S un subconjunto de un espacio euclideo V. Se dice que un 
elemento de V es ortogonal a S si es ortogonal a todo elemento de S. El conjunto 
de todos los elementos ortogonales a S se designa con S 1 y es el «perpendicular 
a S». 


Es un ejercicio sencillo comprobar que S- es un subespacio de V, tanto, 
si S lo es como si no lo es. En el caso en que S sea un subespacio, entonces S 1 se 
llama complemento ortogonal de S. 

ejemplo. Si S es un'piano que pasa por el origen, como se ve en la figu¬ 
ra 1.2, entonces S 1 es una recta por el origen perpendicular a ese piano. Este 
ejemplo da tambien una interpretacion geometrica para el teorema siguiente. 



Figura 1.2 Interpretacion geometrica del teorema de descomposicion ortogonal en V r 
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TEOREMA 1.15. TEOREMA DE LA DESCOMPOSICION ORTOGONAL. Sean V Un 
espacio euclideo y S un subespacio de V de dimension jinita. Todo elemento x 
de V puede representarse en forma unica como una suma de dos elementos, uno 
de S y otro de S- L . Esto es, tenemos 

0-17) x = 5 + , donde se S y 5 X e S®. 

Ademas, la norma de x viene dada por la formula pitagorica 

(1.18) M*= M*+IkHI*. 

Demostracion. Demostremos primero que existe en realidad una descom¬ 
posicion ortogonal (1.17). Puesto que S es de dimension finita, tiene una base 
ortonormal finita, sea esta {e u ..., e „}. Dado x, definimos los elementos s y s ' 
asl: 

(1.19) s = ^ (x, ef)e t , s L — x — s . 

i= 1 

Observemos que cada termino (x, es la proyeccion de x sobre ei. El elemen¬ 
to s es la suma de las proyeccciones de x sobre cada elemento de la base. Puesto 
que s es una combinacion lineal de los elementos de la base, s esta en S. La defi- 
nicion de s x prueba que la ecuacion (1.17) es valida. Para demostrar que 
esta en S x , consideremos el producto interior de s-*- y cualquier elemento e,- de la 
base. Tenemos 

(s x , ef) = (x - s, ef) = (x, e,) - (s, e,) . 

Pero de (1.19), encontramos que (s, ej) = (x, ej), asi que s^-es ortogonal a e,-. 
Por consiguiente s-L es ortogonal a todo elemento de S, lo cual significa que 
s x e S x . 

Probamos a continuation que la descomposicion ortogonal (1.17) es unica. 
Supongamos que x tuviera dos descomposiciones, scan estas 

(1.20) t x = .v + .v-L y x = t + r-L, 

donde s y t estan en S, y .v-L y t x estan en .S’- 1 -. Queremos demostrar que s = t y 
- v ^~ — De (1.2,0), tenemos s — t = f-l — j-L as { q Ue solo necesitamos demos¬ 
trar que s — t == O. Pero s — t e S y /- 1 — P-e5-b con lo que s — t es orto¬ 
gonal a t-l — e igual a A — j-L. Puesto que el elemento cero es el unico ele¬ 
mento ortogonal a si mismo, debe ser s — t — O. Esto demuestra que la descom¬ 
posicion es unica. 
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Finalmente, demostremos que la norma de a: viene dada por la formula pita- 
gorica. Tenemos 

Ill’ll 2 = (x, x) = (s + S 1 , s + s L ) = (s, s ) + O x , S 1 ) , 

siendo nulos los restantes terminos ya que s y s 1 son ortogonales. Esto demues- 
tra (lj. 18). 


definicion. Sea S un subespacio de dimension finita de un espacio euclideo 
V, y sea {e lt ..., e„j una base ortonormal para S. Si x e V, el elemento s defi- 
nido por la ecuacion 

n 

s = 2 (x, e t )e { 

i =i 

se denomina proyeccidn de x sobre el subespacio S. 

Demostramos seguidamente que la proyeccion de x sobre S es la solucion 
del problema de aproximacion establecido al comienzo de esta seccion. 


1.16- Aproximacion optima de elementos de un espacio euclideo por elementos 
de un subespacio de dimension finita 

\ 

teorema 1.16. teorema de aproximacion. Sea S un subespacio de di¬ 
mension finita de un espacio euclideo V, y sea x un elemento de V. La proyeccidn 
de x sobre S es mas prdxima a x que cualquier otro elemento de S. Esto es, si s 
es la proyeccidn de x sobre S, tenemos 

II * ~ s\\ < \\x - 1 1| 

para todo t de S; es valido el signo de igualdad si y sdlo si t = s. 

Demostracion. En virtud del teorema 1.15 podemos escribir x = .v + ,v , 
donde s e S y s ■ e S : . Entonces, para cualquier t de S, tenemos 

x — t = (x — s) J r {s — t) ■ 

Puesto que s — t e S y x — s = s 1 e S L , esta es una descomposicion ortogonal 
de x — t, asi que su norma viene dada por la formula pitagorica 

ll-V - 'IP = ||X .A*|| 2 + ||5 - '|| 2 . 



Aproximacion optima de elementos de un espacio euclideo 


35 


Pero ||s — t\\* > 0, con lo que ||x — /|| 2 > ||x — s|| 2 , valiendo el signo igual si 
y solo si s = t. Esto completa la demostracion. 

eiemplo 1. Aproximacion de funciones continuas en [0, 2 -n],por polino¬ 
mios trigonometricos. Sea V = C(0, 2t r), el espacio lineal de todas las funciones 
reales continuas en el intervalo [ 0 , 27t], y definamos un producto interior mediante 
la ecuacion (/, g) = J' 2 ~ f(x)g(x) dx. En la seccion 1.12 vimos un conjunto orto- 
normal de funciones trigonometricas <P„, <P,,<P 2 , .... donde 

1 , . cos kx , ' sen kx , _ . 

(1.21) f/ 0 (x) = - 7 = , <Pvc-i(x) = — 7 =- , f 2 k( x ) = — 7 =^ , para k > 1 . 

V 277 V 7 T V 77 

Los 2n + 1 elementos <p„, <p u ..., <p w generan un subespacio S de dimension 
2n + 1. Los elementos de S se llaman polinomios trigonometricos. 

Si / e C(0, 27r), sea /„ la proyeccion de / sobre el subespacio S. Tenemos 
entonces 

1*2 

( 1 . 22 ) f n = 2 (/, 'fA'fk ». donde (/, <p k ) = J J{x)<p k (x) dx . 

Los numeros (/, se llaman coeficientes de Fourier de /. Aplicando las formu¬ 
las ( 1 . 21 ), podemos poner ( 1 . 22 ) en la forma 


(l- 23 ) f„(x) = \a 0 + 2 ( a k cos kx + b k sen kx) , 

- i 

donde 

i r* i r 2,r 

= — /(x) cos fex dx , b k = — f(x)senkxdx 

77 Jo 77 Jo 

para k = 0, 1, 2, ..., n. El teorema de aproximacion nos dice que el polinomio 
trigonometrico (1.23) aproxima / mfejor que cualquier otro polinomio trigono- 
metrico de S, en el sentido de que la norma ||/ — /„|| es la mas pequena posible. 

ejemplo 2. Aproximacion de funciones continuas en [ — 1, 1] por polino¬ 
mios de grado < n. Sea V — C( — 1, 1), el espacio de las funciones reales con¬ 
tinuas en [ — 1, 1], y sea (/, g) = JIj/(x) g(x) dx. Los n -f 1 polinomios de Le¬ 
gendre normalizados <p 0 , <p 1 , ..., <p n , introducidos en la seccion 1.14, generan un 
subespacio S de dimension n + 1 que consta de todos los polinomios de grado 
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< n. Si / e C( — 1, 1), designemos con /„ la proyeccion de / sobre S. Tenemos 
entonces 


n C 1 

fn = 2(/> » donde (/, 9 ?*) = f(t)<p k (t) dt. 

*=« J-l 

Este es el polinomio de grado < n para el que la norma ||/ — f„\\ es la menor. 
Por ejemplo, cuando f(x) = sen nx, los coeficientes (/, <Pk) vienen dados por 

(/. <Pk) = J ^sen 7 rt <p k {t) dt. 

En particular, tenemos (f,<P 0 ) = 0 y 

Por consiguiente el polinomio de primer grado / t (/) mas proximo a sen nt en 
t-1, 1] es 

/i(0 = Jyz 9>i(0 = - t. 

> Z 77 77 

Puesto que (/, (P 2 ) = 0, este es tambien la mejor aproximacion cuadratica. 


1.17 Ejercicios 

1. En cada caso, hallar una base ortonormal para el subespacio de V s generado por los 
vectores dados. 

a) Xl =(1, 1, 1), * 2 = (1,0,1), *,=(3,2,3). 

b) x x =(1,1,1), x, =(-1,1, -1), * 3 =(1,0,1). 

2. En cada caso, hallar una base ortonormal para el subespacio de V 4 generado por los 
vectores dados. 

a) *1 = (l 1,0, 0), * 2 = (0, 1, 1,0), * 3 = (0,0, 1, 1), jc 4 = (1,0,0, 1). 

b) x i =(1,1,0, 1), x 2 = (1, 0, 2, 1), * 3 = (1,2, -2, 1). 

3. En el espacio lineal real C(0, 77 ) con producto interior (x, y) = |’jj x(t)y(t)dt, sea 

x„(t) = cos nt para n = 0, 1 , 2. Demostrar que las funciones y 0 , y , ..., dadas 

por 

1 R 

FoCO — y y n {t) =J—cos nt para n > 1 , 

forman un conjunto ortonormal que genera el mismo subespacio que x 0 , x r , x 2 , ... 
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4. En el espacio lineal de todos los polinomios reales, con producto interior (x, y) = 

x(t)y(t)dt, sea x„(t) = t" para n = 0, 1, 2, ... . Demostrar que las funciones 

>'oM = 1 , Ji(0 = V3 (2r - 1) , = V5 ( 6 1 2 - 6t + 1) 

forman un conjunto ortonormal que genera el mismo subespacio que {x 0 , x v x 2 }. 

5. Sea V el espacio lineal de todas las funciones reales / continuas en [0, + 90) y tales 
que la integral j 0 x e t f 2 (t)dt converge. Defmamos (/, g) = J 0 X e *f(t)g(t)dt, y sea y 0 , y lf 
y 2 , .... el conjunto obtenido aplicando el metodo de Gram-Schmidt a x 0 , x , x 2 , 
donde x„(t) = /" para n > 0. Demostrar que y 0 (/) = 1, y x (t) = f — 1, y 2 (<) = < 2 — 4/ + 2, 
y 3 (0 = t 3 - 9t 2 + 18t - 6. 

6. En el espacio lineal real C(l, 3) con producto interior (/, g) = JjJ f(x)g(x)dx, sea 

f(x) — 1/x y demostrar que el polinomio constante g mas proximo a / es g = J log 3. 
Calcular ||g — /[| 2 para este g. 

7. En el espacio lineal real C(0, 2) con producto interior (/, g) = Jjj f(x)g(x)dx, sea 

i(x) = e* y demostrar que el polinomio constante g mas proximo a / es g =|(e 2 — 1). 
Calcular ||g — /|| 2 para este g. 

8. En el espacio lineal real C( —1, 1) con producto interior (/, g) =Ji 1 /(x)g(x)dx, sea 
/(x) = e* y hallar el polinomio g mas proximo a /. Calcular ||g — /]| 2 para este g. 

9. En el espacio lineal real C(0, 2ir) con producto interior (/, g) f(x)g(x)dx, sea 

/(x) = x. En el subespacio generado por u Q {x) = 1, u^x) = cosx, u 2 (x) = senx, hallar 

el polinomio trigonometrico mas proximo a /. 

10. En el espacio lineal V del ejercicio 5, poner /(x) = e~* y hallar el polinomio de primer 
grado mas prdximo a /. 
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TRANSFORMACIONES 
LINEALES Y MATRICES 


2.1 Transformaciones lineales 

Uno de los modernos objetivos del Analisis es un estudio amplio de funcio- 
nes cuyos dominios y recorridos son subconjuntos de espacios lineales. Tales fun- 
ciones se llaman transformaciones, aplicaciones, u operadores. Este capitulo trata 
de los ejemplos mas sencillos, llamados transformaciones lineales, que se presen- 
tan en todas las ramas de la Matematica. Las propiedades de transformaciones 
mas generales se obtienen a menudo aproximandolas mediante transformacio¬ 
nes lineales. 

Introducimos primero la notation y la terminologia mas corriente relativa a 
funciones cualesquiera. Sean V y W dos conjuntos. El simbolo 

T : V W 

se usara para indicar que T es una funcion cuyo dominio es V y cuyos valores 
estan en W. Para cada x de V, el elemento T(x) de W se llama imagen de x 
a traves de T, y decimos que T aplica x en T(x). Si A es un subconjunto cual- 
quiera de V, el conjunto de todas las imagenes T(x) para x de A se llama la ima¬ 
gen de A a traves de T y se representa por T(A). La imagen del dominio V, T(V), 
es el recorrido de T. 

Supongamos ahora que V y W son espacios lineales que tienen el mismo con- 
junto de escalares, y definamos una transformacion lineal como sigue. 

definici<5n. Si V y W son dos espacios lineales, una funcion T:V -> W se 
llama transformacidn lineal de V en W, si tiene las propiedades siguientes: 

a) T(x + y) = T(x) + T(y) cualesquiera que sean x e y de V, 

b) T(cx) = cT(x) para todo x de V y cualquier escalar c. 
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Esto significa que T conserva la adicion y la multiplicacion por escalares. 
Las dos propiedades pueden combinarse en una formula que establece que 

T(ax + by) = aT(x) + bT(y) 

para todo x y todo y de V y todos los escalares a y b. Por induccion, tenemos 
tambien la relacion mas general 

= 2 a t T{x t ) 

\i= 1 / i =1 

para n elementos cualesquiera x l9 ...,x n de V, y n escalares cualesquiera 

Ctlt • » • , On. 

El lector puede comprobar facilmente que los ejemplos siguientes son trans¬ 
formaciones lineales. 

ejemplo 1. Transformacion identica. La transformacion T: V -* V, donde 
T(x) — x para todo x de V, se denomina transformacion identica y se designa 
por / o por l v . 

ejemplo 2. Transformacion cero. La transformacion T:V V que aplica 
cada elemento de V en O se llama transformacion cero y se designa por O. 

ejemplo 3. Multiplicacion por un escalar fijo c. Tenemos aqui T:V V, 
donde T(x) = cx para todo x de V. Cuando c = 1, se trata de la transformacion 
identica. Cuando c = 0, es la transformacion cero. 

ejemplo 4. Ecuaciones lineales. Sean V = V„ y W = V m . Dados mn 
numeros reales a**, con i = 1, 2, ..., m y k = 1,2definamos T: V„ -* V m 
como sigue: T aplica cada vector x = (x lt ..., x„) de V n en el vector y = (y 15 
.... y m ) de V m de acuerdo con las ecuaciones 

n 

yi = 2 ®ik x k para i = 1 , 2, . . ., m . 

ejemplo 5. Producto interior con un elemento fijo. Sea V un espacio real 
euclideo. Para un elemento fijo z de V, definamps T:V ~*R asf: Si x e V, 
T(x) = (x, z), el producto interior de x por z. 

ejemplo 6. Proyeccion sobre un subespacio. Sean V un espacio euclideo 
y S un subespacio de V de dimension finita. Definamos T:V S asi: Si x e V, 
T{x) es la proyeccion de x sobre S. 
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ejemplo 7. El operador derivation. Sea V el espacio lineal de todas las 
funciones reales / derivables en un intervalo abierto la, b). La transformacion 
lineal que aplica cada funcion / de V en su derivada /' se llama operador deriva¬ 
tion y se designa por D. Asi pues, tenemos D:V W, donde D(f)=f para cada 
/ de V. El espacio W contiene todas las derivadas /'. 

ejemplo 8 . El operador integracion. Sea V el espacio lineal de todas las 
funciones reales continuas en un intervalo [ a,b]. Si f e V, definamos g — T(f ) 
como la funcion V dada por 

g(x) = |7(0 dt si a <, x s o . 

Esta transformacion T se llama operador integracion. 


2.2. Nucleo y recorrido 

En esta section, T representa una transformacion lineal de un espacio lineal 
V en un espacio lineal W. 

teorema 2.1. El conjunto T(V) (recorrido de T) es un subespacio de W. 
Ademds, T aplica el elemento cero de V en el elemento cero de W. 

Demostracion. Para demostrar que T(V) es un subespacio de W, tan solo 
necesitamos comprobar los axiomas de clausura. Tomemos dos elementos cuales- 
quiera de T(V), sean T(x) y T(y). Entonces T(x) + T(y) = T(x + y), asi que 
T(x) + T(y) pertenece a T(V). Asimismo, para cualquier escalar c tenemos 
cT(x) = T(cx), con lo que cT(x) pertenece a T(V). Por consiguiente, T(V) es un 
subespacio de W. Tomando c= 0 en la relacion T(cx) = cT(x), encontramos que 
T(0 ) = O. 

definicion. El conjunto de todos los elementos de V que T aplica en O se 
llama nucleo de T y se designa por N(T). Asi pues, tenemos 

N(T ) = {x\xeV y T(x) = O}. 

teorema 2.2. El nucleo de T es un subespacio de V. 

Demostracion. Si x e y estan en N(T), lo mismo les ocurre a x + y y a cx 
para todos los escalares c, ya que 


T(x +_>■) = T(x) + T(y) =0 y 


T(cx ) = cT(x) = O. 
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Los ejemplos que siguen describen los nucleos de las transformaciones linea¬ 
les dadas en la seccion 2.1. 

eiemplo 1. Transformacion identica. El nucleo es { O }, el subespacio 
constituido tan solo por el elemento cero. 

eiemplo 2. Transformacion cero. Puesto que todo elemento de V se aplica 
en cero, el nucleo es el mismo V. 

eiemplo 3. Multiplicacion por un escalar fijo c. Si c¥= 0, el nucleo solo 
contiene el elemento O. Si c = 0, el nucleo es V. 

eiemplo 4. Ecuaciones lineales. El nucleo esta constituido por todos los 
vectores x„) de V„ para los cuales 

n 

J,a ik x k = 0 para i=l,2,...,m. 

k= 1 

eiemplo 5. Producto interior por un elemento fijo z. El nucleo consta 
de todos los elementos de V ortogonales a z. 

eiemplo 6. Proyeccion sobre un subespacio S. Si x e V, tenemos la 
unica descomposicion ortogonal x = s + s-L (segun el teorema 1.15). Puesto que 
T(x) — s, tenemos T(x ) = O si y solo si x = s-k Por consiguiente, el nucleo es 
S-L, el complemento ortogonal de S. 

eiemplo 7. Operador derivacidn. El nucleo esta formado por todas las 
funciones constantes en el intervalo dado. 

eiemplo 8. Operador integracidn. El nucleo contiene solamente la fun- 
cion cero. 


2.3 Dimension del nucleo y rango de la transformacion 


Tambien en esta seccion T representa una transformacion de un espacio lineal 
V en un espacio lineal W. Nos interesa la relacion entre las dimensiones de V, del 
nucleo N(T) y del recorrido T(V). Si V es de dimension finita, el nucleo tambien 
lo sera por ser un subespacio de V. En el teorema que sigue, demostramos que 
el recorrido T(V) tambien es de dimension finita; su dimension se llama rango 
de T. 
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teorema 2.3. Si V es de dimensidn finita, tambien lo es T(V), y tenemos 

(2.1) dim N(T ) + dim T(V) — dim V. 

Dicho de otro modo, la dimensidn del nucleo mas el rango de una transformacion 
lineal es igual a la dimensidn de su dominio. 

Demostracion. Sean n = dim V y e,,... ,e k una base para N(T), donde 
k = dim N(T) < n. Segun el teorema 1 .1; esos elementos forman parte de una • 
cierta base de V, por ejemplo de la base 

(2.2) Ci,. . ., e k , e k+ i ,. . ., e k+T , 

donde k + r — n. Demostraremos que los r elementos 

T(e k+ 0,. . ., T(e k , r ) 

forman una base de 7"( V), demostrando asi que dim T(V) = r. Puesto que k+r=n, 
tambien eso demuestra (2.1). 

Demostramos primero que los r elementos de (2.3) generan T(V). Si 
y e T(V), es y = T(x) para un cierto x de V, y podemos escribir x = c x e x + 
+ ... + Ck +r ek+r. Luego, tenemos 



puesto que Tie,) = ... —T(ek)= O. Esto demuestra que los elementos (2.3) 
generan T(V). 

Demostremos ahora que esos elementos son independientes. Supongamos que 
existieran escalares c k+1 ,.... c k+r tales que 

k-\r 

2 cj(e t ) = 0. 

i=k+l 



Esto implicaria que 
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por lo que el elemento x = c* +1 e* +1 + ... + Ck+^k+r seria del nucleo N(T). Sig- 
nifica esto que existirfan escalares c u ..., c* tales que x — c,e, + ... + Ckek, con 
lo que tendrfamos 


k k+r 

X — X = ^ c i e i — 2 C i e i = 0 • 
i =l t=yt+i 

Pero como los elementos (2.2) son independientes, todos los escalares c, han de 
ser cero. Por consiguiente, los elementos (2.3) son independientes. 


Nota: Si V es de dimensidn infinita por lo menos uno de los dos N(T) o T(V) es 
de dimension infinita. En el ejercicio 30 de la Seccidn 2.4 se esboza una demostracion 
de este hecho. 


2.4 Ejercicios 


En cada uno de los ejercicios del 1 al 10, se define una transformacion T: V 2 —» V 2 
mediante la formula dada para T(x, y ), donde (x, y) es un punto cualquiera de V 2 . Deter- 
minar en cada caso si T es lineal. Si T es lineal, decir cuales son el nucleo y el recorrido, y 
calcular sus dimensiones 


1. T(x, y) = (y, x). 

2. T(x,y) = (x, -y) 

3. T(x, y) = (x, 0). 

4. T(x, y) = (x, x). 

5. T(x,y) =(x 2 ,/). 


6. T(x, y) = (e x , e v ). 

7. T(x,y) = (x, 1). 

8. r(x,j) = (x + l,y + 1). 

9. T(x,y) = (x - y,x + y). 

10. T(x,y) = (2x - y,x + y). 


Hacer lo mismo en cada uno de los ejercicios del 11 al 15. Si la transformacidn 
T: V 2 —> V 2 es la que se indica. 

11. T hace girar cualquier punto el mismo angulo <f> alrededor del origen. Esto es, T aplica 
un punto de coordenadas polares (r,0) en el punto de coordenadas polares (r, 0 + <f>), 
donde <f> es fijo. Ademas, T aplica O en si mismo. 

12. T aplica cada punto en su simetrico respecto a una recta fija que pasa por el origen. 

13. T aplica todo punto en el punto (1, 1). 

14. T aplica cada punto de coordenadas polares (r, 0) en el punto de coordenadas (2 r,6). 
Ademas, T aplica O en si mismo. 

15. T aplica cada punto de coordenadas polares (r, 0) en el punto de coordenadas (r, 2d). 
Ademas, T aplica O en si mismo. 


Hacer lo mismo en cada uno de los ejercicios 16 al 23 si la transformacion T:V 3 ~> V 3 
esta definida por la formula que se da para T(x, y, z), donde (x, y, z) es un punto arbitrario 
de y 3 . 


16. T(x,y,z ) = (z, y, x). 

17. T(x, y, z) =(x,j, 0). 

18. T(x,y, z) = (x, 2 y, 3z), 

19. T(x,y, z) — (x, y, 1). 


20. T(x,y, z) = (x + \,y + l,z - 1). 

21. T{x, y, z) = (x + 1, y + 2, z + 3). 

22. T(x,y,z) =(x,j 2 ,z 3 ). 

23. T(x,-y, z) = (x + z, 0, x + y). 
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En cada uno de los ejercicios del 24 al 27, la transformacion T: V V es la que se 
indica. Determinar, en cada caso, si T es lineal. Si lo es, decir curies son el nucleo y el 
recorrido y calcular sus dimensiones cuando sean finitas. 

24. Sea V el espacio lineal de todos los polinomios reales p(x) de grado < n. Si p e V, 
r q = T(p)\ significa que q(x) = p(x -f 1) para todo real x. 

25. Sea V el espacio lineal de todas las funciones reales derivables en el intervalo abierto 
( — 1, 1). Si / e V, g = T(f) significa que g(x) = xf'(x) para todo x de ( — 1,1). 

26. Sea V el espacio lineal de todas las funciones reales continuas en [a, 6]. Si f eV, 
g = T(f) significa que 


g(x) = J*/(f) sen(* - t ) dt 


para a <, x < b . 


27. Sea V el espacio de todas las funciones reales derivables dos veces en un intervalo 
abierto (a, b). Si y e V, definir T(y) = y" + Py' + Qy siendo P y Q dos constantes. 

28. Sea V el espacio lineal de todas las sucesiones reales convergentes {x„}. Definimos una 
transformacion T:V V asi: Si x = {*„} es una sucesion convergente con limite a, 
ponemos T(x) = {y„}, donde y„ = a — x n para n > 1. Demostrar que T es lineal y decir 
cuales son el nucleo y el recorrido de T. 

29. Sea V el espacio lineal de todas las funciones continuas en el intervalo [ — it, n]. Sea S 
el subconjunto de V que consta de todas las funciones / que satisfacen las tres ecuaciones 


f f(t)dt= 0, (" /(/) cos / dt = 0, f’ f(t) sen tdt = 0 . 

► If J —17 J —It 

a) Demostrar que S es un subespacio de V. 

b) Demostrar que S contiene las funciones j(x) = cos nx y f(x) = sen nx para cada 
n = 2, 3, ... 

c) Demostrar que S es de dimension infmita. 

Sea T:V-»y la transformacion lineal defmida asf: Si / e V, g = T(/) significa que 

g(x) = {1 + cos (x - t)}f(t) dt . 


30 . 


d) Demostrar que T(V), el recorrido de T, es de dimension finita y hallar una base 
para T(V). 

e) Determinar el nucleo de T. 

f) Hallar todos los numeros reales c * 0 y todas las funciones / no nulas de V tales que 
•<(/) — cf. (Observese que una tal / pertenece al recorrido de T.) 

w a T transformaci6n linea! de un ^Pacio lineal V en un espacio lineal 

W hI %, V es , de dimen sion infmita, demostrar que por lo menos uno de los dos T(V) 
o N(T) es de dimension infmita. 


[ Indication: Supongase dim V(7 ) = k, dim 7 ( V) = r, sea e x , ..., et una base 
para N(T) y sean e\, ..., e k , e k+ i, ... e k+n elementos independientes de V, siendo 
n>r. Los elementos 7’(e»+]),..., T(e k ,„) son dependientes ya que n > r. Utilizar 
este hecho para obtener una contradiccion.] 
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2.5 Operaciones algebraicas con transformaciones lineales 

Las funciones cuyos valores pertenecen a un espacio lineal dado W pueden 
sumarse unas con otras y pueden multiplicarse por escalares de W de acuerdo 
con la definicion siguiente. 

definicion. Sean S:V W y T:V W dos funciones con un dominio 
cotnun V y con valores pertenecientes a un espacio lineal W. Si c es un escalar 
cualquiera de W, definimos la suma S + T y el producto cT por las ecuaciones 

(2-4) (S + T)(x) = Six) + T(x), ( cT)(x ) = cT(x) 

para todo x de V. 

Nos interesa especialmente el caso en el que V es tambien un espacio lineal 
con los mismos escalares que W. En este caso designamos con T£{ V, W) el con- 
junto de todas las transformaciones lineales de V en W. 

Si S y T son dos transformaciones lineales de V, IV), es un sencillo ejerci- 
cio comprobar que S+T y cT tambien son transformaciones lineales de S£{V, W). 
Aun mas. Con las operaciones que acabamos de definir, el mismo conjunto 
, ( £( V, W ) se transforma en un nuevo espacio lineal. La transformacion cero sirve 
de elemento cero en ese espacio, y la transformacion (— 1 )T es la opuesta de T. 
Se comprueba que se satisfacen los diez axiomas de un espacio lineal. Por con- 
siguiente, tenemos el siguiente. 

teorema 2.4. El conjunto V£{V, W) de todas las transformaciones linea¬ 
les de V en W es un espacio lineal con las operaciones de adicion y multiplica- 
cion por escalares definidas en (2.4). 

Una operacion algebraica mas interesante que se efectua con las transfor¬ 
maciones lineales es la composicion o multiplicacion de transformaciones. Esta 
operacion no utiliza la estructura algebraica de un espacio lineal y puede definirse 
con entera generalidad del siguiente modo. 

definici6n. Dados los conjuntos U, V, W. Sean T:U V una funcion con 
dominio U y valores en V, y S: V W otra funcion con dominio V y valores en 
W. La composicion ST es la funcion ST:U -* W definida por 

(ST)(x ) = S[T(x)} para todo xenU. 

Asi pues, para aplicar x mediante la composicion ST, aplicamos primero x 
mediante T y luego aplicamos T{x) por medio de S. Esto se representa en la figu- 
ra 2.1. 



Operacioiws algebraical con transformaciones lineales 


47 



Figura 2.1 Grdjico de la composicion de dos transformaciones. 

La composition de funciones reales se ha encontrado repetidas veces en 
nuestro estudio del Calculo, y hemos visto que la operation, en general, no es 
conmutativa. No obstante, como en el caso de las funciones reales, la composi¬ 
tion satisface la ley asociativa. 

teorema 2.5. Si T:U -*■ V, S:V W, y R:W -* X son tres funciones, te- 
nemos 


R(ST) = (RS)T. 

Demostracion. Las funciones R(ST) y ( RS)T tienen ambas dominio U y 
valores en X. Para cada x de V, tenemos 

[R(ST))(x) - R[(ST)(x)} = R[S[T(x)}} y {(RS)T}(x) = (RS)[T(x)] = R[S[T(x)}], 
lo que demuestra que R(ST ) = ( RS)T. 

definicion. Sea T: V V una funcion que aplica V en si mismo. Defini- 
mos jnductivamente las potencias enteras de T como sigue: 

T° = I. T n = TT n ~ x para n > I. 

Aqui / representa la transformacion identica. El lector puede comprobar que 
la ley asociativa implica la ley de exponentes 7'”T n = 7 1 " 4 ” para todos los ente- 
ros no negativos m y n. 

El teorema que sigue prueba que la composition de transformaciones lineales 
es lineal. 
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teorema 2.6. Si U, V, W son espacios lineales con los mismos escalares, 
y si T:U~*V y S:V-»W son transformaciones lineales, la composicion ST-.U^W 
es lineal. 

Demostracidn. Para todo x y todo y de U y todos los escalares a y b, te- 
nemos 

(ST)(ax + by) = S[T(ax + by)] = S[aT(x) + bT(y )] = aST(x) + bST(y). 

La composicion puede combinarse con las operaciones algebraicas de adicion 
y multiplication por escalares en , ( £{ V, W) llegando al siguiente 

teorema 2.7. Sean U, V, W espacios lineales con los mismos escalares, 
supongamos que S y T pertenecen a -£( V, H 7 ), y sea c un escalar cualquiera. 

a) Para cualquier funcion R con valores en V, tenemos 

(S + T)R = SR + TR y ( cS)R = c(SR). 

b) Para cualquier transformacion lineal R:W -* U, tenemos 

R(S + T) = RS + RT y R(cS) = c(RS). 

La demostracidn es una consecuencia inmediata de la definicion de compo- 
sicion y se deja como ejercicio. 


2.6 Inversas 

Al estudiar las funciones reales aprendimos como construir nuevas funciones 
mediante la inversion de funciones monotonas. Queremos ahora extender el me- 
todo de inversion a una clase mas general de funciones. 

Dada una funcion T, nuestro objetivo es encontrar, si es posible, otra funcion 
S cuya composicion con T sea la transformacion identica. Puesto que la compo- 
sicion, en general, no es conmutativa, tenemos que distinguir ST de TS. Por lo 
tanto introducimos dos tipos de inversas que llamamos inversa por la derecha e 
inversa por la izquierda. 

definicion. Dados dos conjuntos V y W y una funcion T:V -* W. Se dice 
que una funcion S:T(V) -» V es inversa de T por la izquierda si S[T(x)] = x 
para todo x de V, esto es, si 

ST=Iy, 
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donde I v es la transformation identica sobre V. Una funcion R:T(V) V se 
llama inversa de T por la derecha si T[f?(y)] — y para todo y de T(V), esto es, si 

TR — It(v) > 

donde It(v> es la transformation identica sobre T(V). 

ejemplo. Una funcion sin inversa por la izquierda pero con dos inversas 
por la derecha. Sean V = {l,2}yW = {0}. Definimos T:V W como sigue: 
T( 1) = T(2) = 0. Esta funcion tiene dos inversas por la derecha R:W -» V y 
R':W -* V dadas por 


R{ 0) = 1 , R'( 0) = 2 . 

No puede tener inversa por la izquierda S ya que ello exigiria 
1 = S[J(1)] = S(Q) y 2 = S[T(2)] = S( 0). 

Este sencillo ejemplo pone de manifiesto que no tiene que existir necesariamente 
inversa por la izquierda y que la inversa por la derecha no tiene que ser necesa¬ 
riamente unica. 

Toda funcion T:V -* W tiene por lo menos una inversa a la derecha. En efec- 
to, cada y de T(V) tiene la forma y = T{x) para al menos un x de V. Si elegimos 
uno de esos valores x y definimos R(y) = x, entonces T[i?(y)] = T{x) = y para 
cada y de T(V), asi que R es una inversa por la derecha. La no unicidad puede pre- 
sentarse debido a que puede haber mas de un x de V que se aplique en un y de 
T(V). Dentro de poco demostraremos (teorema 2.9) que si cada y de T(V) es 
la imagen de un solo x de V, la inversa por la derecha es unica. 

Antes demostraremos que si existe inversa por la izquierda es unica y, al mismo 
tiempo, es inversa a la derecha. 

teorema 2.8. Una T:V W puede tener a lo mas una inversa por la 
izquierda. Si T tiene inversa por la izquierda S, entonces S es tambien inversa 
por la derecha. 

Demostracion. Supongamos que T tenga dos inversas por la izquierda, 
S:T(V) -» V y S':T(V) -* V. Elijamos cualquier y en T(V). Demostraremos que 
S(y) = S'(y). Como y = Tlx) para un cierto x de V, tenemos 


S[T(x)] = x 


y STO] = x 
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puesto que S y S' son ambas inversas por la izquierda. Por consiguiente S(y) = x 
y S\y) = x, con lo que S(y) = S'(y) para todo y de T(V). Por lo tanto S — S' 
lo que demuestra que las inversas por la izquierda coinciden. 

Demostremos ahora que toda inversa por la izquierda S es tambien inversa 
por la derecha. Elijamos un elemento cualquiera y en T(V), Demostraremos que 
T[S(y)] = y. Puesto que y e T(V), tenemos y = T(x) para un cierto x de V. Pero 
S es inversa por la izquierda, asf que 

x = S[r(*)] = S(y). 

Aplicando T, llegamos a T(x) = T[S(y)]. Pero y = Tlx), con lo que y = T[S(y)], 
lo cual completa la demostracion. 

El teorema que sigue caracteriza todas las funciones que tienen inversa por 
la izquierda. 

teorema 2.9. Una funcion T:V -* W tiene inversa por la izquierda si y 
solo si T aplica elementos distintos de V en elementos distintos de W; esto es, 
si y solo si, para cualesquiera x e y de V, 

(2.5) x j±y implica T(x) # T(y). 

Nota: La condition (2.5) es equivalente a la afirmacidn 

(2.6) T(x) = T(y) impljca x = y. 

Una funcion T que satisface (2.5) o (2.6) para cualesquiera x e y de V se denomina 
uno a uno en V. 

Demostracion. Supongamos que S es la inversa por la izquierda de T, y que 
T(x) = T( y). Queremos demostrar que x=y. Aplicando S, encontramos S[7(x)] = 
S[jT(y)]. Puesto que S[T(x)] = x y S[T(y)] = y, esto implica x — y. Con ello 
queda demostrado que una funcion con inversa por la izquierda es uno a uno en 
su dominio. 

Demostremos ahora el reciproco. Supongamos que T es uno a uno en V. 
Encontraremos una funcion S:T(V) -* V que es inversa de T por la izquierda. 
Si y e T(V), entonces y = T(x) para un cierto x de V. En virtud de (2.6), exis- 
te exactamente un x en V para el cual y = T(x). Defmamos S(y) como ese x. Esto 
es, defmamos S en T(V) como sigue: 

S(y) = x implica que T(x) = y . 

Tenemos entonces S[T(x)] = x para cada x de V, asi que ST = I v . Por consi¬ 
guiente, la funcion S asi definida es inversa de T por la izquierda. 
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definici6n. Sea T:V -> W uno a uno en V. La unica inversa de T por la 
izquierda (la cual sabemos que tambien es inversa por la derecha) se designa 
por T \ Decimos que T es invertible, y llamamos a T 1 la inversa de T. 

Los resultados de esta seccion se refieren a funciones cualesquiera. Seguida- 
mente aplicamos esas ideas a las transformaciones lineales. 


2.7 Transformaciones lineales uno a uno 

En esta seccion, V y W representan espacios lineales con los mismos esca- 
lares, y T:V -> W es una transformacion lineal de W). La linealidad de T 

nos permite expresar de varias maneras la propiedad de que una transformacion 
lineal sea uno a uno. 

teorema 2.10. Sea T:V -> W una transformacion lineal de W). 
Son equivalentes las siguientes proposiciones. 

a) T es uno a uno en V. 

b) T es invertible y su inversa T~ lm .T(V) -* V es lineal. 

c) Para todo x de V, T(x) — O implica x — O. Esto es, el nucleo N(T) con¬ 
vene solamente el elemento cero de V. 

Demostracion. Demostraremos que a) implica b), b) implica c), y c) impli¬ 
ca a). Supongamos primero que a) es cierta. T tiene entonces inversa (segun el 
teorema 2.9), y tenemos que demostrar que T~ x es lineal. Tomemos dos elemen¬ 
ts cualesquiera u y v de T(V). Entonces u = T(x) y v = T(y) para algun x y 
algun y de V. Para dos escalares cualesquiera a y b, tenemos 

au + bv = aT(x ) + bT(y) = T(ax + by ), 
ya que T es lineal. Luego, aplicando T _1 , tenemos 

T~\au + bv) = ax + by = aT~\u) -f- bT~\v ), 

asi que T _1 es lineal. Por consiguiente a) implica b). 

Supongamos seguidamente que b) es cierta. Tomemos un x cualquiera de V 
para el cual T(x) = O. Aplicando T _1 , encontramos que x = T HO) = O, puesto 
que T- 1 es lineal. Por consiguiente, b) implica c). 

Por ultimo, supongamos cierta c). Tomemos dos elementos cualesquiera u 
y v de V siendo T(u) — T(v). Por la linealidad, tenemos T(u — v) = T(u) — T(v) = 
= O, asf que u—v — O. Por consiguiente, T es uno a uno en V, y queda comple- 
tada la demostracion del teorema. 
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Cuando V es de dimension finita, la propiedad de ser uno a uno puede for- 
mularse en funcion de la dependencia y de la dimensionalidad, como se indica 
en el teorema que sigue. 

teorema 2.11. Sea T:V -» W una transformacion lineal de £?(V, W) y 
supongamos que V es de dimension finita, dim V = n. Entonces son equivalentes 
las proposiciones siguientes. 

a) T es uno a uno en V. 

b) Si e l ,, e p son elementos independientes de V, T(e,),..., T(e p ) son 
elementos independientes de T(V). 

c) dim T(V) = n. 

d) Si {e t ,... ,e„} es una base para V, { T(e,),..., T(e„)} es una base 
para T(V). 

Demostracidn. Probaremos que a) implica b), b) implica c), c) implica d), 
y d) implica a). Supongamos que a) es cierta. Sean e x ,..., e p elementos indepen¬ 
dientes de V y consideremos Ios elementos T(e x ),.... T(e p ) de T(V). Suponga¬ 
mos que 

jUw-o 

i—1 

para ciertos escalares c x ..... c p . En virtud de la linealidad, obtenemo? 

( P \ V 

2 C i e l 1 = 0, y por tanto £ c t e ( = 0 

i= 1 / i ■ 1 

ya que T es uno a uno. Pero e x ,... ,e p son independientes, asi que c x = ... = 
c p = 0. Por consiguiente a) implica b). 

Supongamos ahora que es cierta b). Sea {e x ,... ,en} una base para V. Segun 
b), los n elementos T(e,),..., T(e„) de T(V) son independientes. Por consiguien¬ 
te, dim T(V) > n. Pero, segun el teorema 2.3, tenemos dim T(V) < n. Luego 
dim T(V) = n, con lo cual b) implica c). 

Supongamos, seguidamente, que es cierta c) y sea {e x ,..., e„} una base para 
V. Tomemos un elemento cualquiera y en T(V). Entonces y = T(x) para algun 
x en V, asi que tenemos 

n n 

x = 2 c i e i > y p° r tant0 y = T ( x ) = 1 c i r ( e i) ■ 

t=1 i =1 

Por consiguiente {T(e x ),..., T(e„)} genera T(V). Pero hemos supuesto que 
dim T(V) = n, asi que { T(e x ),..., T(e„)} es una base para T(V). Por consi¬ 
guiente c) implica d). 
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Por ultimo, supongamos cierta d). Demostraremos que T(x) = O implica 
x — O. Sea {e 1 ,..., e„} una base para V. Si x e V, podemos escribir 

n n 

X = 2 C,e t , y por tanto T(x) = £ qT(e,). 

i =1 i =1 

Si X(x) = O, entonces c,=.. .= c„ = 0, puesto que los elementos T(e ,),.... T(e n ) 
son independientes. Por lo tanto x = O, con lo cual T es uno a uno en V. Asi 
pues, d) implica a) y el teorema queda demostrado. 

2.8 Ejercicios 


1. Sea V = {0,1}. Describir todas las funciones T:V -* V. En total son cuatro. Desig- 
nense con T x , X 2 , T z , T y construir una tabla de multiplicacion que muestre la com¬ 
posicion de cada par. Indicar cuales son uno a uno en V y dar sus inversas. 

2. Sea V = {0, 1, 2}. Describir todas las funciones T:V V para las cuales T(V) — V. 
En total son seis. Desfgnense con T v T t ,..,T e y construir una tabla de multiplicacion 
que muestre la composicion de cada par. Indicar cuales son uno a uno en V, y dar sus 
inversas. 


En cada uno de los ejercicios del, 3 al 12, una funcion T: V 2 —» V 2 se define con la 
formula que se da para T(x, y), siendo (x, y) un punto cualquiera de V 2 . Determinar en 
cada caso si T es uno a uno en V 2 . Si es asi, describir su recorrido T(V 2 ); para cada punto 
(u, v) de T(V 2 ), poner (x, y) = T '(u, y) y dar formulas para determinar x e y en funcion 
de u y v. 


3. T(x,y) =(y,x). 

4. T(x,y) = (x, -y). 

5. T(x,y) =(x, 0). 

6. T(x,y) =\x,x). 

7. T(x,y) = (x 2 ,/). 


8. T(x,y) =(e x , e«). 

9. T(x, y) = (x, 1). 

10. T(x,y) =(x + 1 ,y + 1). 

11. T(x,y) = (x -y,x + y). 

12. T(x, y) — (2x -y,x+y). 


En cada uno de los ejercicios del 13 al 20, se define una funcion T:V 3 ~> V 3 con la 
fdrmula que se da para T(x,y,z), siendo (x, y, z) un punto cualquiera de V 3 . En cada caso, 
determinar si T es uno a uno en V 3 . Si es asi, describir su recorrido T(V a ); para cada punto 
(«, v, w) de T(V 3 ), pongase (x, y, z) = X _1 (u, v, w) y dar formulas para, la determinacion de 
x, y, z en funcion de u, v, y w. 


13. T(x,y,z) = (z, y, x). 

14. X(x, y, z) = (x, y, 0). 

15. T(x, y, z) = (x, 2y, 3z). 

16. X(x, y, z) = (x, y, x + y + z). 


17. T(x,y, z) = (x + \,y + 1, z - 1). 

18. T(x,y, z) = (x + l,y + 2, z + 3). 

19. X(x, y, z) = (x, x + y, x + y + z). 

20. X(x, y, z) = (x + y, y + z, x + z). 


21. Sea T:V —>V una funcidn que aplica V en si mismo. Por induccidn se definen las 
potencias con las fdrmulas T° = 1, T n — TT n ~ x para n > 1. .Demostrar que la ley 
asociativa para la composicion implica la ley de exponente: T m T n — T m ' n . Si T es in¬ 
vertible, demostrar que T * tambien es invertible y que (7’ n )' 1 = (T ') n . 
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En los ejercicios del 22 al 25, S y T representan funciones con dominio V y valores 
en V. En general ST # TS. Si ST = TS, decimos que S y T conmutan. 

22. Si S y T conmutan, demostrar que (ST) n = S n T n para cualquier entero n > l). 

23. Si S y T son invertibles, demostrar que ST tambien lo es y que (ST) -1 = T~ l S~\ Dicho 
de otro modo, la inversa de ST es la composition de las inversas, tomadas en orden 
inverso. 

24. Si S y T son invertibles y conmutan, demostrar que sus inversas tambien conmutan. 

25. Sea V un espacio lineal. Si S y T conmutan, demostrar que 

(S + Tf = S 3 + 2ST + T 2 y (S + T) 3 = S 3 + 3 S 2 T + 3ST 2 + T 3 . 

Indicar como deben modificarse esas formulas si ST ^ TS. 

26. Sean S y T las transformaciones lineales de V 3 en V 3 definidas por las formulas 
Six, y, z) = (z, y, x) y T(x, y, z) — (x, x + y, * + j + z), siendo ( x , y, z) un punto cual- 
quiera de V 3 

a) Determinar la imagen de ( x, y, z) a trav6s de cada una de las transformaciones si- 

guientes: ST, TS, ST - TS, S 2 , T 2 , (ST) 2 , (TS) 2 , (ST - TS) 2 . 

b) Demostrar que S y T son uno a uno en V 3 y hallar la imagen de ( u, v, w) a traves 

de cada una de las transformaciones: S* 1 , T -1 , (ST) -1 , (TS) -1 . 

c) Hallar la imagen de (x, y, z) a traves de (T — /)" para cada n>\. 

27. Sea V el espacio lineal de todos los polinomios reales p(x). Sean D el operador deriva- 
ci6n y T el operador integration que aplica cada polinomio p en un polinomio q dado 
por q(x) = fgp(t)dt. Demostrar que DT =I V pero que TD ^ I v . Describir el nucleo y 
el recorrido de TD. 

28. Sea V el espacio lineal de todos los polinomios reales p(x). Sean D el operador deri¬ 
vation y T la transformacion lineal que aplica p(x) en xp'(x). 

a) Poner p(x) = 2 + 3x — x 2 + 4x 3 y determinar la imagen de p a traves de cada una 

de las transformaciones siguientes: D, T, DT, TD, DT — TD, T 2 D 2 — D 2 T 2 . 

b) Determinar los polinomios p de V para los cuales T(p) — p. 

c) Determinar los polinomios p de V para los cuales (DT — 2 D)(p) = O. 

d) Determinar los polinomios p de V para los cuales (DT — TD) n (p) = D n (p). 

29. Sean V y D como en el ejercicio 28 pero T es la transformacion lineal que aplica p(x) en 
xp(x). Demostrar que DT — TD = / y que DT n — T n D = nT n l para todo n > 2. 

30. Sean S y T dos transformaciones lineales de SC (V, V) y supongamos que ST — TS = I. 
Demostrar que ST n — T n S = nT n_1 para todo n > 1. 

31. Sea V el espacio lineal de todos los polinomios p(x). Sean R, S, T funciones que apli- 

can un polinomio cualquiera p(x) = c 0 + + .. .|+ c„x" de V|en los polinomios r(x), 

s(x) y t(x) respectivamente, siendo 


r(x) = p( 0) , s(x) = £ c k x k 1 , t(x) = 2 c k x k+1 . 

fc=l fc=0 

a) Poner p(x) = 2 + 3x — x 2 + x 3 y determinar la imagen de p a traves de cada una 
de las transformaciones siguientes: R, S, T, ST, TS, (TS) 2 , T 2 S 2 , S 2 T 2 , TRS, RST. 

b) Demostrar que R, S y T son lineales y determinar el nucleo y el recorrido de cada 
una. 

c) Demostrar que T es uno a uno en V y determinar su inversa. 

d) Si n > 1, expresar (TS) n y S n T n en funcion de / y R. 

32. En relacion con el ejercicio 28 de la Seccion 2.4. Determinar si T es uno a uno en V. 
Si lo es, decir cual es la inversa. 
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2.9 Transformaciones lineales con valores asignados 

Si V es de dimension finita, siempre podemos construir una transformacion 
lineal T: V -* W con valores asignados a los elementos base de V, como se explica 
en el teorema siguiente. 

teorema 2.12. Sea e lt ... ,e„ una base para un espacio lineal n-dimen- 
sional V. Sean u, ,..., u„, n elementos arbitrarios de un espacio lineal W. Existe 
entonces una y solo una transformacion T:V -* W tal que 

(2.7) T{e k ) = u k para k = 1,2 ,...,«. 

Esta transformacidn T aplica un elemento cualquiera x de V del modo siguiente: 

n n 

(2-8) Si x = 2 x k e k , entonces T(x) —'£ r x k u k . 

k =1 fc=l 

Demostracion. Todo x de V puede expresarse en forma unica como combi- 
nacion lineal de e x ,... ,e„, siendo los multiplicadores x x ,... ,x„ los componen- 
tes de x respecto a la base ordenada (e x ,..., e„). Si definimos T mediante (2.8), 
conviene comprobar que T es lineal. Si x = e* para un cierto k, entonces todos 
los componentes de x son 0 excepto el fc-esimo, que es 1, con lo que (2.8) da 
T(e k ) = Uk, como queriamos. 

Para demostrar que solo existe una transformacion lineal que satisface (2.7), 
sea T' otra y calculemos T'(x). Encontramos que 

T'(x) = T'i^x^A =jt x *T'(e k ) = = T(x). 

\k=l / k= 1 k=l 

Puesto que T\x) = T(x) para todo x de V, tenemos T’ = X, lo cual completa la 
demostracion 

EJEMPLO. Determinar la transformacion lineal T: V 2 -* V 2 que aplique los 
elementos base i = (1,0) y j = (0, 1) del modo siguiente 

m = i+j, T(j) = 2i — j. 

Solucidn. Si x = x x i + x 2 j es un elemento arbitrario de K 2 , entonces T(x) 
viene dado por 

T(x) = x x T(i) + x 2 T(j ) = x x {i + j ) + x 2 (2i — j ) = (x x -f 2 x 2 )j + {x x — x 2 )j. 
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2.10 Representation matricial de las transformaciones lineales 

El teorema 2.12 demuestra que una transformation lineal T:V -*■ W de un 
espacio lineal de dimensidn finita V esta determinada por su action sobre un 
conjunto dado de elementos base e ly ... ,e n . Supongamos ahora que el espacio W 
tambien es de dimension finita, por ejemplo dim W = m, y sea w, ,..., w„ una 
base para W. (Las dimensiones n y m pueden ser o no iguales.) Puesto que T 
tiene los valores en W, cada elemento T(e k ) puede expresarse, con unicidad, como 
una combination lineal de los elementos de la base w, ,..., w m , por ejemplo 

m 

T ( e k) = 2 um , 

i =1 

donde t lk ,..., t mk son los componentes de T(e k ) respecto a la base ordenada 
{w 1 ,..., w m ). Dispondremos verticalmente la m-pla (t lk ,..., t mk ), como a con- 
tinuacion se indica: 


(2.9) 




‘2k 


‘mk_l 


Esto se llama vector columna o matriz columna. Tenemos una tal columna para 

cada uno de los n elementos T(e,). T(e„). Colocandolas una junto a otra y 

encerrandolas en un par de corchetes obtenemos la disposition rectangular si- 
guiente: 

*11 *12 ‘ ‘' *ln 
*21 *22 ' ' ' *2 n 


I_*ml ^m2 ’ ’ * ^mn_J 


Este cuadro se llama matriz y consta de m filas y n columnas. La llamamos matriz 
m X n. La primera fila es la matriz 1 X n (/„ , t 12 ,..., t,„). La matriz m X 1 
(2.9) es la fc-esima columna. Los escalares U k van afectados con dos indices, el 
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primero i indica la fila y el segundo k indica la columna en las cuales aparece t ik . 
A t* le llamamos el elemento ik de la matriz. Tambien se utiliza la notation abre- 
viada 

«*). o WXL 

para designar la matriz cuyo elemento ik es tik. 

As\ pues, toda transformacion lineal T de un espacio n-dimensional V en un 
espacio m-dimensional W da origen a una matriz m X n (t ik ) cuyas columnas son 
los componentes de T(e j),..., T(e„) relativos a la base (w, ,.. ., w m ). La lla¬ 
mamos representacidn matricial de T relativa a unas bases ordenadas (e, ,..., e„) 
de V y (Wj,..., w m ) para W. Una vez conocida la matriz (t ik ), los componentes 
de un elemento cualquiera T(x) con relacion a la base (Wj ,..., w m ) pueden deter- 
minarse como se explica en el teorema que sigue. 

teorema 2.13. Sea T una transformacion lineal perteneciente a &(V, W), 
donde dim V = n y dim W = m. Sean (e, ,. . ., e„) y (w, ,... ,w m ) bases orde¬ 
nadas de V y W, respectivamente, y (tik) la matriz m X n cuyos elementos estan 
determinados por las ecuaciones 


( 2 . 11 ) 


m 


T(e k ) = J, t ik w t , 

i=l 


para k = 1,2,.. 


n . 


Entonces un elemento cualquiera 


( 2 . 10 ) x=J r x h e k 

k =1 

de V con componentes (x k ,, x„) relativo a (e t ,,e„) es aplicado por T 
en el elemento 


(2.12) T(x) = Zy (Wi 

i =1 

en W con componentes (y t ,..., y m ) relativos a w m ). Los y, estan 

ligados a los componentes de x mediante las ecuaciones lineales 


y< 


n 



k =1 


para i — 1,2,.. 


m. 


(2.13) 


• 9 
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Demostracidn. Aplicando T a cada uno de los miembros de (2.11) y uti- 
lizando) (2.10), obtenemos 


n n m m / n \ 

T(x) = 2 ^T(e k ) = J>,x k 2 — xL I 2 hk x k \ w i ~ 

k —1 k—1 i=l i=l \fr=l I 

en donde cada y, viene dada por (2.13). Esto completa la demostracion. 

Habiendo elegido un par de bases (e x ,..., e„) y (iv t . w m ) para V y W, 

respectivamente, toda transformacion lineal T:V W tiene una representacion 
matricial (/,*). Recfprocamente, si disponemos de mn escalares colocados formando 
una matriz rectangular (tit) y elegimos un par de bases ordenadas para V y W, 
es facil demostrar que existe exactamente una transformacion lineal T:V W 
que tiene esa representacion matricial. Definimos T simplemente con los elementos 
base de V por medio de las ecuaciones (2.10). Entonces, segun el teorema 2.12, 
existe una y solo una transformacion T:V W con esos valores asignados. La ima- 
gen T(x) de un punto x de V viene entonces dada por las ecuaciones (2.12) y 
(2.13). 

ejemplo 1. Construccion de una transformacidn lineal a partir de una ma¬ 
triz dada. Supongamos que disponemos de la matriz 2x3. 

"3 1 -T 
1 0 4 

Elijamos las bases usuales de vectores coordenados unitarios para V 3 y V 2 . En¬ 
tonces la matriz dada representa una transformacidn lineal T: V 3 V 2 que aplica 
un vector cualquiera (x,, x 2 , x 3 ) de V 3 en el vector (y lt y 2 ) de V 2 de acuerdo con 
las ecuaciones lineales 


Iw. 

1=1 


Ji = 3xj + x 2 - 2x 3 
y 2 = + 0x 2 + 4 x 3 . 

ejemplo 2. Construccidn de una representacidn matricial de una transfor¬ 
macidn lineal dada. Sea V el espacio lineal de todos los polinomios reales p(x) 
de grado < 3. Este espacio tiene dimension 4, y elegimos la base (1, x, x 2 , x :r ). 
Sea D el operador derivacion que aplica cada polinomio p(x) de V en su deri- 
vada p'(x). Podemos considerar D como una transformacion lineal de V en W, 
donde W es el espacio tri dimensional de todos los polinomios reales de grado < 2. 
En W elegimos la base (l,x, x 2 ). Para encontrar la representacidn matricial de D 
relativa a esa eleccion de bases, transformamos (derivamos) cada elemento base 
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de V y lo expresamos como una combination lineal de los elementos base de W. 
Asf pues, encontramos que 

D(l) = 0 = 0 + Ox + Ox 2 , D(x) = 1 = 1 + Ox + Ox 2 , 

Z)(x 2 ) = 2x = 0 + 2x + Ox 2 , Z)(x 3 ) = 3x 2 = 0 + Ox + 3x 2 . 

Los coeficientes de esos polinomios determinan las columnas de la representation 
matricial de D. Por consiguiente, la representation pedida viene dada por la si- 
guiente matriz 3X4. 


'0 1 0 O' 

0 0 2 0. 

0 0 0 3_ 

Para hacer notar el hecho de que la representation matricial depende no sola- 
mente de los elementos base sino tambien de su orden, invirtamos el orden de los 
elementos base enWy utilicemos, en su lugar, la base ordenada (x 2 , x, 1). Enton- 
ces los elementos base de V se transforman en los mismos polinomios obtenidos 
antes, pero los componentes de estos relativos a la nueva base (x 2 , x, 1) aparecen 
en orden inverso. Por consiguiente, la representation matricial de D ahora es 

'0 0 0 3' 

0 0 2 0 . 

0 1 0 0_ 

Calculemos una tercera representation matricial de D, usando la base 
(1, 1 + x, 1 + x + x 2 , 1 + x + x 2 + x 3 ) para V, y la base (1, x, x 2 ) para W. 
Los elementos base de V se transforman asi: 

■0(1) = 0, D( 1 + x) = 1, D{ 1 + x + x 2 ) = 1 + 2x , 

Z>(1 + x + x 2 + x 3 ) = 1 + 2x + 3x 2 , 

con lo que la representation matricial en este caso es 

"0 111' 

0 0 2 2 . 

0 0 0 3 
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2.11 Construction de una representation matricial en forma diagonal 

Ya que es posible obtener distintas representaciones matriciales de una trans¬ 
formation lineal dada mediante la election de bases distintas, parece natural 
intentar elegir bases de modo que la matriz resultante tenga una forma lo mas 
sencilla posible. El teorema que sigue prueba que podemos hacer todos los ele- 
mentos 0 excepto los de la diagonal que va desde el vertice superior izquierdo al 
inferior derecho. A lo largo de esa diagonal habra una hilera de unos seguidos 
de ceros, siendo el numero de unos igual al rango de la transformation. Una 
matriz (f,*) con todos los elementos t,* = 0 cuando i ¥= k se llama matriz dia¬ 
gonal. 

teorema 2.14. Sean V y W espacios lineales de dimension finita, con 
dim V — n y dim W = m. Slupongamos que T e (V, W) y que r — dim T(V) 
represente el rango de T. Existen entonces una base e„) para V y otra 

(»!,..., w„) para W tales que 

(2.14) T(e t ) = H’i para i = 1, 2,..., r, 

y 

(2.15) T(e = O para i = r -f 1 

Por consiguiente, la matriz (/,•*) de T relativa a esas bases tiene todos los elementos 
cero excepto los r elementos de la diagonal que valen 

hi — hi — ' ' ' = t rT = 1 . 

Demostracidn. Construimos primero una base para W. Puesto que T(V) 
es un subespacio de W con dim T(V) = r, el espacio T(V) tiene una base de r 
elementos en W, sean estos iv,,..., w,. Segun el teorema 1.7, esos elementos 
forman un subconjunto de una cierta base para W. Por consiguiente podemos ad- 
juntar unos elementos w r +i,. ■ >, w m de modo que 

(2.16) (wj.,.. ., w r , w r+1 
sea una base para W. 

Seguidamente construimos una base para V. Cada uno de los r primeros 
elementos de (2.16) es la imagen por lo menos de un elemento de V. Elijamos 
uno de tales elementos de V y llamemosle e*. Entonces T(e,) = w, para i — 1, 
2,... ,r asi que (2.14) se satisface. Sea ahora k la dimension del nucleo N(T). 
Segun el teorema 2.3 tenemos n = k + r. Puesto que N(T) = k, el espacio N(T) 
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tiene una base que consta de k elementos de V que designamos por e r +, ,, e r +k- 
Para cada uno de esos elementos, la ecuacion (2.15) se satisface. Por lo tanto, 
para completar la demostracion, tenemos que demostrar que el conjunto ordenado 

(2.17) 

e r+l > • • • > e r+k) 

es una base para V. Ya que dim V = n = r + k, solo tenemos que demostrar 
que esos elementos son independientes. Supongamos que una cierta combination 
lineal de ellos sea cero, por ejemplo 

T~\~Jc 

(2-18) 2^ = 0. 

i=1 

Aplicando T y haciendo uso de las ecuaciones (2.14) y (2.15), encontramos que 

r-\-k T 

2 c i T ( e i) = 2 c i w i = 0 ■ 

i =1 t=l 

Pero iv, ,..., w T son independientes, y por tanto Ci = ... = c r = 0. Por consi- 
guiente, los r primeros terminos de (2.18) son cero, por lo cual (2.18) se re¬ 
duce a 


r+k 

2 c i e i = o . 

i=r +1 

Pero e r+1 ,... ,e r +k son independientes puesto que forman una base para N(T), 
y por tanto c r+1 =... — c r +k = 0. Por consiguiente, todos los c, de (2.18) son 
cero, luego los elementos de (2.17) forman una base para V. Esto completa la 
demostracion. 

ejemplo. Nos referimos al ejemplo 2 de la seccion 2.10, donde D es el 
operador derivacion que aplica el espacio V de los polinomios de grado < 3 
en el espacio W de los polinomios de grado < 2. En este ejemplo, el recorrido 
T(V) = W, as( que T tiene rango 3. Aplicando el metodo seguido en el teorema 
2.14, elegimos cualquier base para W, por ejemplo la base (l,x, x 2 ). Un con- 
junto de polinomios de V que se aplica sobre esos elementos es (x, lx 2 , lx 3 ). 
Ampliamos este conjunto para lograr una base para V adjuntando el polinomio 
constante 1, que es una base para el nucleo de D. Por consiguiente, si empleamos 
la base (x, lx 2 , lx 3 , 1) para V y la base (l,x, x 2 ) para W, la correspondiente 
representacion matricial para D tiene la forma diagonal 

'1 0 0 O' 

0 10 0 . 

0 0 10 
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2.12 Ejercicios 

En todos los ejercicios en los que se considere el espacio vectorial V„, la base que se 
utilizara sera la de los vectores coordenados unitarios si no se dice lo contrario. En los ejer¬ 
cicios relativos a la matriz de una transformacidn lineal 7: V —> W siendo V = W, si no se 
indica lo contrario tomaremos la misma base en V y en IV. 

1. Determinar la matriz de cada una de las siguientes transformaciones lineales de V„ en V„: 

a) la transformacion identica, 

b) la transformaci6n cero, 

c) multiplication por un escalar fijo c. 

2. Determinar la matriz para cada una de las siguientes proyecciones. 

a) T: V 3 -»• V 2 , donde T(x 1 , x 2 , x 3 ) = (x x , x 2 ). 

b) 7: V 3 -* V 2 , donde T(x l , x 2 , x 3 ) = (x 2 , x 3 ). 

c) T: K 5 — V 3 , donde T(x x , x 2 , x 3 , x 4 , x 5 ) = (x 2 , x 3 , x 4 ). 

3. Una transformacion lineal T:V 2 —>V 2 aplica los vectores base i y j como sigue: 

T(i) = / +j , T(j) = 2/ - j . 

a) Calcular 7(3/ - 4/') y T 2 (3i — 4j) en funcion de i y j. 

b) Determinar la matriz de T y de T 2 . 

c) Resolver la parte b) si la base (/,/) se reemplaza por (e v e 2 ), siendo e 3 = » — j, e 2 

— 3/ +/ 

4. Una transformacion lineal T:V 2 ~» V 2 se define asi: Cada vector (x,y) se transforma en 
su simetrico respecto al eje y y luego se duplica su longitud para obtener T(x, y). De¬ 
terminar la matriz de T y la de T 2 . 

5. Sea T: V 3 -> V 3 una transformacidn lineal tal que 

T(k) = 2/ + 3 j + 5k , T(j -f k) = i , T(i + j + k) =j - k . 

a) Calcular T(i + 2j + 3A)y determinar la dimension del nucleo y el rango de T. 

b) Determinar la matriz de T. 

6. Para la transformacion lineal del ejercicio 5, se consideran las dos bases coincidentes 
con (e t , e 2 , e s ), siendo ei = (2, 3, 5), e 2 = (1, 0, 0), e 3 — (0, 1, — 1) y determinar la 
matriz T relativa a las nuevas bases. 

7. Una transformacion lineal T: V —> V aplica los vectores base como sigue: 777) = (o 0) 
7(i)= (1, 1), T(k) = (1, -1). 

a) Calcular 7(4/ — j + k)y determinar la dimensidn del nucleo y el rango de 7. 

b) Determinar la matriz de 7. 

c) Utilizando la base (i,j, k) en V, y la (w v w 2 ) en V 2 , siendo u-i = (1,1), w, = (1,2), 
determinar la matriz de 7 relativa a esas bases. 

d) Hallar las bases (e v e 2 , e 3 ) para V 3 y (w\, w 2 ) para V 2 para las cuales la matriz de 
7 tenga la forma diagonal. 

8. Una transformacidn lineal 7: V 2 —* V aplica los vectores base como sigue: T(i) = 
(1, 0, 1), 0, 1). W 

a) Calcular 7(2/ — 3y)y determinar la dimension del nucleo y el rango de 7. 

b) Determinar la matriz de 7. 

c) Hallar bases (c ] ,e 2 ) para V 2 y (w, . w 2 , w 3 ) para V 3 para las cuales la matriz de 7 
tiene forma diagonal. 

9. Resolver el ejercicio 8 si 1, 0, 1) y T(j) = (1, 1, 1). 
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10. Sean V y W dos espacios lineales, ambos de dimension 2 y con la misma base (e, , e 2 ). 
Sea T:V —*W una- transformation lineal tal que 

T{e 1 + e 2 ) = 1e 1 + 9e 2 , T{ 3e x + 2e 2 ) = le 1 + 23e 2 . 

a) Calcular T(e, — e t ) y determinar la dimension del nucleo y el rango de T. 

b) Determinar la matriz de T relativa a la base dada. 

c) Utilizar para V la base (e 1 , e 2 ) y hallar una nueva base de la forma (e i + ae 2 , 
2e 1 + be 2 ) para W, para la que la matriz de T tenga la forma diagonal. 

En el espacio lineal de todas las funciones reales, cada uno de los siguientes conjuntos 
es independiente y genera un subespacio V de dimension finita. Utilizar el conjunto dado 
como base para V y sea D-.V —>V el operador derivation. En cada caso, hallar la matriz 
de D y la de D 2 relativa a la base que se elige. 

11. (sen*, cos x). 15. (— cos x,sen x). 

12. (l,x,e x ). 16. (senx, cos x, x senx, x cos x). 

13. (1,1 + x, 1 + x + e x ). 17. (e x sen x, e x cos x). 

14. (e*, xe*). 18. (e 2 * sen 3x, e 2x cos 3x). 

19. Elegir la base (1, x, x 2 , x 3 ) en el espacio lineal V de todos los polinomios reales de 
grado <; 3. Sean D el operador derivacion y T:V ~>V la transformation lineal que 
aplica p(x) en xp'(x). Con relation a la base dada, determinar la matriz de cada una 
de las transformaciones siguientes: a) T; b) DT; c) TD; d) TD — DT; e) T 2 ; 
f) T 2 D 2 - D 2 T 2 . 

20. Con respecto al*ejercicio 19. Sea W la imagen de V a traves de TD. Hallar bases para 
V y IV para las que la matriz TD tenga forma diagonal. 


2.13 Espacios lineales de matrices 

Hemos visto como las matrices se presentan espontaneamente como represen- 
taciones de las transformaciones lineales. Tambien se pueden considerar las ma¬ 
trices como elementos existentes con independencia de las transformaciones linea¬ 
les. Como tales elementos, forman otra clase de objetos matematicos que pueden 
definirse por medio de las operaciones algebraicas que pueden realizarse con ellos. 
La relacion con las transformaciones lineales da origen a esas definiciones, pero 
tal relacion sera por el momento ignorada. 

Sean m y n dos enteros positivos y sea I m „ el conjunto de todos los pares de 
enteros O', /) tales que 1 < i <, m, 1 < /' < n. Cualquier funcion A cuyo dominio 
sea Ini# se denomina matriz m X n. El valor de la funcion A(i, j) se llama elemen- 
to ij de la matriz y se designara tambien por a,,-. Ordinariamente se disponen 
todos los valores de la funcion en un rectangulo que consta de m filas y n co- 
lumnas, del modo siguiente 

~ a u a l2 ' ' ' @ln~ 

°21 a 22 ' ' ‘ a 2n 


'-&m\ &m2 ’ 
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Los elementos a,,- pueden ser objetos arbitrarios de naturaleza cualquiera. Normal- 
mente seran numeros reales o complejos, pero a veces conviene considerar matrices 
cuyos elementos son otros objetos, por ejemplo, funciones. Tambien designaremos 
las matrices mediante la notacion abreviada 

A = (<»„)“£ o A = (a a ) . 

Si m = n, la matriz se llama cuadrada. Una matriz 1 X n se llama matrix fila; 
una matriz m X 1 es una matriz columna. 

Dos funciones son iguales si y solo si tienen el mismo dominio y toman los 
mismos valores en cada elemento del dominio. Puesto que las matrices son fun¬ 
ciones, dos matrices A = (a„) y B = (bn) son iguales si y solo si tienen el mismo 
numero de filas, el mismo numero de columnas, e iguales elementos a,, = bn para 
cada par (/, /). 

Supongamos ahora que los elementos son numeros (reales o complejos) y 
defmamos la adicion de matrices y la multiplicacion por escalares siguiendo el 
mismo metodo que para funciones reales o complejas cualesquiera. 

definicion. Si A = (an) y B — (bn) son dos matrices m X n y si c es un 
escalar cualquiera, definimos las matrices A + B y cA del modo siguiente 

a + B = (a i} + b i} ) , cA = (ca t> ). 

La suma solo se define cuando A y B tienen el mismo tamano m X n. 


ejemplo. Si 

f5 0 11 


tenemos entonces 



r6 2 -21 


r 2 4 -61 


'-5 o -r 

A -f B = 

1 

o 

1 

K> 

1_ 

, 2A = 

1 

1 

to 

o 

oo 

1_ 

, (-1)5 = 

.-1 2 -3. 


Definimos la matriz O como la matriz m X n cuyos elementos son todos 0. 
Con esas definiciones, es inmediato el ejercicio de comprobar que el conjunto de 
todas las matrices m X n es un espacio lineal. Lo designamos con M m ,„. Si los ele¬ 
mentos son numeros reales, el espacio M m ,„ es un espacio lineal real. Si son nu¬ 
meros complejos, M m „ es un espacio lineal complejo. Es tambien facil demostrar 
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que este espacio es de dimension m X n. En efecto, una base para M m .„ consta 
de mn matrices que tienen un elemento igual a 1 y todos los demas iguales a 0. 
Por ejemplo, las seis matrices 


o 

o 
_1 


o 

o 

1 _ 


o 

o 

_1 


1 

o 

o 

o 

1 _ 


[ 

o 

o 

o 

L _ 


o 

o 

o 

1 

o 

o 

o 

L . 

9 

[ 

o 

o 

o 

1 _ 

’ 

I 

o 

o 

o 

1 _ 

’ 

1 

o 

o 

_ 1 

9 

1 

o 

o 

_ 1 

9 

1 

o 

o 

1 _ 


forman una base para el conjunto de todas las matrices 2X3. 


2.14 Isomorfismo entre transformaciones lineales y matrices 


Volvamos ahora a la relacion entre matrices y transformaciones lineales. 
Sean V y W dos espacios lineales de dimension finita con dimV —n y dimW = m. 
Elijamos una base (ei,... , e„) para V y otra (wi ,..., w m ) para W. En esta 
discusion esas bases se mantienen fijas. Designemoscon 'JXV, W) el espacio lineal 
de todas las transformaciones lineales de V en W. Si T e W), sea m(T) la 
matriz de T relativa a las bases dadas. Recordemos que m{T) se define como sigue. 

La imagen de cada elemento base ek se expresa como una combinacion lineal 
de los elementos base de W: 

m 

( 2 ' 19 ) T ( e k) = 2 hk^t para k = 1,2, ... , n . 

i = 1 

Los multiplicadores escalares Uk son los elementos ik de m(T). Asf pues, tenemos 

( 2 - 2 °) rn(T) = (t ik )2Z, • 

La ecuacion (2.20) define una nueva funcion m cuyo dominio es J?(V, W) y 
cuyos valores son matrices de M m ,«. Puesto que toda matriz m X n es la matriz 
m(T) para una cierta T de W), el recorrido de m es M m ,«. El teorema si- 
guiente prueba que la transformacion m: ^{V, W)- > M m , n es lineal y uno a uno 
en &{y, W). 

teorema 2.15. teorema de isomorfismo. Para cualesquiera S y T de 
■^(V, W) y todos los escalares c, tenemos 


Ademas, 


m(S + T) — m(S ) + m(T) 


m(S) = m(T) 


asi que m es uno a uno en fV). 


y 


m(cT) = cm(T ) . 


implica S — T, 
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Demostracion. La matriz m(T) esta formada con los factores Uk de (2.19). 
Del mismo modo, la matriz m(S) esta constituida con los factores s.-jt de las ecua- 
ciones 

m 

(2.21) S(e k ) = 2 s ik Wi para k = 1, 2. n . 

i=l 

Puesto que tenemos 

m m 

(S + T)(e k ) = 2 (s lk + hM y (cT)(e k ) = (ct lk )w 1 , 

obtenemos m(S 4- T) = (s ik 4- /,•*) = m(S) + m(T) y m(cT) = ( ct ,■*) = cm(J). 
Esto demuestra que m es lineal. 

Para demostrar que m es uno a uno, supongamos que m(S) = m(T), siendo 
S = ( sa ) y T = (t,i). Las ecuaciones (2.19) y (2.21) demuestran que S(e k ) = 
= T(e k ) para cada elemento base e k , asf que S(x) = T(x) para todo x de V, y por 
tanto S = T. 

Observation: La funcion m es un isomorfismo. Elegidas unas bases, m establece 
una correspondencia uno a uno entre el conjunto de las transformaciones (V,W) y 
el conjunto M m ,„ de las matrices m X n. Las operaciones de adicion y multiplicacion por 
escalares se conservan a traves de esa correspondencia. Los espacios lineales J? ( V , W) 
y M m ,„ se dice que son isomorfos Incidentalmente, el teorema 2.11 demuestra que el 
dominio de una transformacion lineal uno a uno tiene la dimension igual a su recorrido. 
Por consiguiente, dim SC(V, VP) = dim M„,„ = mn. 

Si V = W y elegimos la misma base para ambos, la matriz m(l) correspon- 
diente a la transformacion identica /: V V es una matriz diagonal con los ele- 
mentos de la diagonal iguales a 1 y todos los demas iguales a 0. Esta se llama 
identidad o matriz unidad y se designa con / o con /„. 


2.15 Multiplicacion de matrices 

Algunas transformaciones lineales pueden multiplicarse por medio de la com- 
posicion. Definiremos ahora la multiplicacion de matrices de manera que el pro- 
ducto de dos matrices corresponda a la composicion de las transformaciones linea¬ 
les que ellos representan. 

Recordemos que si T:U -> V y S:V -> W son transformaciones lineales, su 
composicion ST: U -* W es una transformacion lineal dada por 

ST(x) = S’fT’fx)] para todo x de U . 

Supongamos que U, V, y W son de dimension finita, por ejemplo 

dim V = p, 


dim U — n, 


dim W — m . 
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Elijamos bases para U, V, y W. Con relacion a esas bases m(S) es una matriz 
mX p, T es una matriz p X n , y ST es una matriz m X n . La si- 
guiente definicion de multiplicacion de matrices nos permite deducir la relacion 
m(ST ) = m(S)m(T). Esto extiende a los productos la propiedad de isomorfismo. 


definicion. Sean A una matriz m X p cualquiera, y B una matriz p X n 
cualquiera, tales como 

A = (a i fi;U y B = {b^. 

El producto AB se define como la matriz m X n, C=(Ci,), cuyo elemento ij viene 
dado por 

V 

( 2 . 22 ) c^j = 2 a ikbkj ' 

k=1 

Observation: El producto AB solo esta definido si el ntimero de columnas de 
A es igual al de filas de B. 


Si escribimos At para expresar la fila i de A y B’ para la columna 
j de B, y las imaginamos como vectores de dimension p, la suma (2.22) es sim- 
plemente el producto escalar At • B’. Es decir, el elemento ij de AB es el producto 
escalar de la fila i de A por la columna j de B: 

AB = (A, ■ BXjli 

Asi pues, la multiplicacion de matrices puede considerarse como una generaliza- 
cion del producto escalar. 



' 3 

1 2~ 


*4 

6' 

ejemplo 1. Sean A = 

-1 

1 0 

y B = 

5 

-1 




_0 

2_ 


Puesto que A es 2 X 3 


y B es 3 X 2, el producto AB es la matriz 2X2 


AB = 


\Ai ■ B 1 

A x • B 2 ~ 


'17 

21' 

1 

X 

to 

tg 

i 

N 

CQ 


1 

— 7_ 


Los elementos de AB se calculan asi 

A 1 • B 1 = 3 • 4 + 1 • 5 + 2 • 0 = 17, A^ B* = 3 • 6 + 1 ■ (-1) + 2 • 2 = 21 , 
A^-B 1 = (— 1) • 4 + 1 - 5 + 0-0 = 1, A 2 -B 2 = (— 1) • 6 + 1 - (-I) + 0 • 2 = -7 . 
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ejemplo 2. Sea 







'-2' 


'2 1 

-3' 




A = 

J 2 

4_ 

y 

B = 

1 






2_ 


Aquf Aes2X3y6es3X 1, con lo que AB es la matriz 2X1 dada por 


'-9' 

» 

8 _ 

Puesto que A x - B x = 2 • (-2) + 1 • 1 + (-3) • 2 = -9 y A 2 ■ B 1 = 1 • (-2) + 
+ 2 - 1 + 4-2 = 8. 

ejemplo 3. Si A y B son dos matrices cuadradas del mismo tamano, enton- 
ces AB y BA estan defmidas. Por ejemplo, si 


AB = 


A x ■ B 1 
A ■ B\ 


H 41 


encontramos que 



"13 

8~ 


r-i ioi 

AB = 

. 2 

-2 

, BA = 

- 1 

<N 

_i 



Este ejemplo prueba que en general AB ¥= BA. Si AB — BA, decimos que A y B 
son permuiables o que conmutan. 

ejemplo 4. Si I p es la matriz identidad p X p,entonces/ p A = A para toda 
matriz A, p X n, y BI P = B para toda matriz B, m X p. Por ejemplo: 


‘i 

0 

0" 


"2" 


'2' 





"1 

0 

O' 





0 

1 

0 






'l 

2 

3 






'l 

2 

3' 


3 

= 

3 





0 

1 

0 




0 

0 

1 






4 

5 

6 






4 

5 

6 


4_ 


4 


L 




0 

0 

1 






Demostramos seguidamente que la matriz de una composicion ST es el pro- 
ducto de las matrices m(S) y m(T). 
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teorema 2.16. Sean T:ll V y S:V W dos transformaciones lineales, 
donde U, V, W son espacios lineales de dimensidn finita. Entonces, elegidas unas 
bases fijas, las matrices de S, T y ST estan relacionadas por la ecuacion 

m(ST ) = m(S)m(T) . 

Demostracion. Supongamos que dim U = n, dim V = p, dim W = m. Sean 
(«i,..., u») una base para U,{v lt ..., v P ) una base para V,y (w t ,..., w m ) una 
base para W. Con relation a esas bases tenemos 


m(S) = 


donde 

S{v k ) = 2 s ik Wi 

1 = 1 

para 

k= 1,2,.. 

■>P 

m(T) = 

r> 

donde 

T(Uj) = 2 hpk 

para 

j= 1,2,.. 

., n 


Por consiguiente, tenemos 

V Pm m / p \ 

ST(Uj) = S[T(u 3 )] =J,t kj S(v k ) =2,t kj 2 S ik w { = 2 2 SiA; vv t ., 

1 fc=l i =1 t=l \ k = 1 / 


con ello encontramos que 


( p \m,n 

%s ik t kj ) = m(S)m(T). 

/i,#=i 

Ya hemos observado que la multiplicacidn de matrices no siempre satisface 
la ley conmutativa. El teorema siguiente prueba que satisface las leyes asociativa 
y distributiva. 

TEOREMA 2.17. LEYES ASOCIATIVA Y DISTRIBUTIVA PARA LA MULTIPLICA- 
ci6n de matrices. Dadas las matrices A, B, C. 

a) Si los productos A{BC) y ( AB)C tienen sentido, tenemos 

A(EC) — (AB)C (ley asociativa). 

b) Supongamos que A y B sean del mismo tamaho. Si AC y BC tienen sen¬ 
tido, tenemos 

(A + B)C = AC A BC (ley distributiva por la derecha), 

en tanto que si CA y CB tienen sentido, tenemos 

C(A + B) = CA + CB (ley distributiva por la izquierda). 
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Demostracidn. Esas propiedades pueden deducirse directamente a partir de 
la definition de multiplicacion de matrices, pero preferimos razonar del siguiente 
modo. Introduzcamos los espacios lineales de dimension finita U, V, W, X y las 
transformaciones lineales T-.U -> V, S:V W, R:W X tales que fijadas unas 
bases, tenemos 


A = m{R), B = m(S), C = m(T ) . 

Segun el teorema 2,16, es m(RS) = AB y m(ST) — BC. De la ley asoeiativa 
para la composicion, encontramos que R(ST) = (RS)T, Aplicando el teorema 
2 16 una vez mas a esa ecuacion, obtenemos m(R)m(ST) = m(RS)m(T) o 
A(BC) — ( AB)C, que demuestra a). La demostracidn de b) puede hacerse con 
un razonamiento parecido. 

definicion. Si A es una matriz cuadrada, definimos la potencia entera de 
A por induccion como sigue: 

A 0 — I, A n = AA n ~ x para n )> 1, 


2.16 Ejercicios' 


r 1 —4 1 

1. Si A = 

L-l 4 -2 
BA, AC, CA, A(1B - 3C). 



■ i 

2" 


'2 

2' 

, B = 

-i 

3 

, c = 

1 

-1 


5 

—2_ 


_1 

—3_ 


, calcular B + C, AB, 


2. Sea A 


o r 
o 2 


. Hallar todas las matrices B, 2x2, tales que a) AB = O; b) BA = O. 
3. Hallar en cada caso a, b, c, d para que se satisfaga la ecuacion dada. 


o 

T —1 

o 

o 


~a 


T 

10 0 0 


b 


9 

0 10 0 


c 


6 

O 

o 


d_ 


.5. 


n o 2 oi 


b) 


‘ abed ' 
,14 9 2 


0 0 11 
0 10 0 
,0 0 10 . 


'1 0 6 6 ' 
.19 8 4 
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4. Calcular en cada caso AB — BA. 



'1 2 2' 


“ 4 

r 


a) A = 

2 1 2 

, B = 

-4 

2 0 

; 


1 2 3_ 


1 

2 1. 



O 

o 


" 3 

1 -2' 

b) A = 

1 1 

2 

, B = 

3 

-2 4 


-1 2 

1 


—3 

5 11_ 


5. Si A es una matriz cuadrada, demostrar que A n A m = A M+m para todos los enteros 
m > 0, n > 0. 



'I r 


ri 2i 



6. Sea A = 

.0 1. 

. Comprobar que A 2 = ^ 

y calcular A". 



*cos fl 

—sen 0 


'cos 20 —sen 20' 


7. Sea A - 

sen 0 

cos 0_ 

. Comprobar que A 2 = 

sen 20 cos 2 0_ 

y calcular A B . 



'1 

1 

r 


'1 

2 

3 ' 

8 . Sea A = 

0 

1 

1 

. Comprobar que A 2 = 

0 

1 

2 


0 

0 

1 


0 

0 

1 


. Calcular A 3 y A*. Suponer 


una formula general para A " y demostrarla por induccion. 


9. Sea 4 = 


1 

-1 


O' 

1 


Demostrar que A 2 = 2/4 — / y calcular A 100 . 


10. Hallar todas las matrices 4,2x2, tales que A 2 = O. 

11. a) Probar que una matriz A, 2x2, conmuta con cualquier matriz 2 X 2 si y solo si 
A conmuta con cada una de las cuatro matrices 


'1 O' 


'0 

r 


o 

o 


1 

o 

1 — 

o 

-0 0. 

9 

.0 

o_ 

9 

Li o. 

9 

0 

ij 


b) Hallar todas esas matrices A. 

12. La ecuacion A 2 = I se satisface para cada una de las matrices 2X2 


'1 0* 


o 


'1 

b- 

-0 1. 

9 

Lc -ij 

9 

.0 

-1. 
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donde bye son numeros reales arbitrarios. Hallar todas las matrices A, 2x2, tales 
que A 2 = I. 


13. Si A = 


- 2 

-r 

II 

>> 

"7 

ON 

-1 

-2 

3_ 

' i 

.9 

81 


hallar matrices C y D, 2 X 2, tales que 


AC =B y DA = B. 


14. a) Comprobar que las identidades algebraicas 


(A + B) 2 = A 2 + 2 AB + B 2 y 


(A + B)(A — B) — A 2 — B 2 


no son ciertas para las matrices 2x2 , A — 


-i -r 
0 2 


y fl = 


'1 0 ' 
1 2 


b) Modificar el segundo miembro de esas identidades para obtener formulas validas 
para todas las matrices cuadradas A y B. 

c) tPara que matrices A y B son validas las identidades establecidas en a)? 


2.17 Sistemas de ecuaciones lineales 

Sea A = (an) una matriz mXnde numeros dada, y sean c 1 .... ,c m otros 
m numeros. Un conjunto de m ecuaciones de la forma 

n 

(2.23) J,a ik x k =c i para i = 1, 2,. . . , m , 

Ar=l 

se llama sistema de m ecuaciones lineales con n incognitas. Consideramos 
,x„ como incognitas. Una solucion del sistema es una n-pla cualquiera de 

numeros (x,. x„) para los que se satisfacen todas las ecuaciones. La matriz A 

se llama matriz de los coeficientes del sistema. 

Los sistemas lineales pueden estudiarse por medio de las transformaciones 
lineales. Elegimos las bases usuales de vectores coordenados unitarios en V„ y V,„. 
La matriz de los coeficientes A determina una transformacion lineal, jT:V„ -» V„„ 
que aplica un vector arbitrario x = (x, ,..., x„) de V„ en el vector y ~ (y 1 ,, 
y m ) de V m dado por las ecuaciones lineales 

n 

= 'E a nc x k para / = 1, 2,. . ., m . 

Jc=l 
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Sea c = (c,. c m ) el vector de V m cuyos componentes son los numeros que 

aparecen en el sistema (2.23). Este sistema puede escribirse mas sencillamente 
poniendo 


T(x) = c . 

El sistema tiene una solucion si y solo si c esta en el recorrido de T. Si un solo 
x de V„ se aplica en c, el sistema tiene una sola solucion. Si mas de un x se 
aplica en c, el sistema admite mas de una solucion. 

ejemplo 1. Un sistema sin solucion. El sistema x + y = l, x + y = 2 
no tiene solucion. La suma de dos numeros no puede ser a la vez 1 y 2. 

ejemplo 2. Un sistema con solucion unica. El sistema x + y = 1, 
x — y = 0 tiene exactamente una solucion: (x, y) = (|, D- 

ejemplo 3. Un sistema con mas de una solucidn. El sistema x + y — 1, 
que consta de una ecuacion con dos incognitas, tiene mas de una solucion. Dos 
numeros cualesquiera cuya suma sfea 1 dan una solucion. 

A cada sistema lineal (2.23), podemos asociar otro sistema 


^, a ikX k — 0 para i = 1 , 2,. . ., m , 

fc=l 

obtenido reemplazando cada c, en (2.23) por 0. Este se llama el sistema homo¬ 
geneo correspondiente al (2.23). Si c^O, el sistema (2.23) se llama no ho¬ 
mogeneo. Un vector x de V„ satisfara el sistema homogeneo si y solo si 


T(x) = O, 


donde T es la transformacion lineal determinada por la matriz de los coeficientes. 
El sistema homogeneo tiene siempre la solucion x = O, pero puede tener otras. 
El conjunto de soluciones del sistema homogeneo es el nucleo de T. El teorema 
siguiente expone la relacion entre las soluciones del sistema homogeneo y las del 
sistema no homogeneo. 

teorema 2.18. Supongamos que el sistema no homogeneo (2.23) tenga 
una solucidn, por ejemplo b. 

a) Si un vector x es una solucidn del sistema no homogeneo, entonces el 
vector v — x — b es una solucidn del correspondiente sistema homo¬ 
geneo. 
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b) Si un vector v es una solucion del sistema homogeneo, el vector x=v + b 
es una solucion del sistema no homogeneo. 

Demostracion. Sea T:V„-* V m la transformation lineal determinada por la 
matriz de los coeficientes, como antes se ha dicho. Puesto que b es una solucion 
del sistema no homogeneo tenemos T(b) = c. Sean x y v dos vectores de V„ tales 
que v = x — b. Entonces tenemos 

T(v) = T(x -b)= T(x) - T(t) = T(x) - c 
Por consiguiente T(x) = c si y solo si T(v) = O. Esto demuestra a la vez a) y b). 

Este teorema prueba que el problema de hallar todas las soluciones de un 
sistema no homogeneo se escinde en dos partes: 1) Hallar todas las soluciones 
v del sistema homogeneo, esto es, determinando el nucleo de T; y 2) hallar una 
solucion particular b del sistema no homogeneo. Sumando b a cada uno de los 
vectores v del nucleo T, se obtienen todas las soluciones x = v + b del sistema 
no homogeneo. 


Sea k la dimension de N(T). Si podemos encontrar k soluciones independien- 
tes v 1 .... ,v k del sistema homogeneo, ellas formaran una base para N(T), y po¬ 
demos obtener cualquier v de 1V(T) formando todas las combinaciones lineales 

v = v i + ' " + ‘ k v k , 


donde t x ,... ,tt son escalares arbitrarios. Esta combination lineal se llama solu¬ 
cion general del sistema homogeneo. Si b es una solucion particular del sistema no 
homogeneo, entonces todas las soluciones x vienen dadas por 


x — b + t x v x + • • • + t k v k . 


Esta combinacion lineal se llama solucion general del sistema no homogeneo. 
El teorema 2.18 puede ponerse en esta otra forma: 

teorema 2.19. Sea T:V n V m la transformacion lineal tal que T(x) = y, 
donde x = (x, ,..., x„), y = (y x ,.. ., y m ), e 

n 

yi = 'I,a ik x k para i = 1, 2. m . 

k= 1 
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Sea k la dimension del nucleo de T. Si v , ,. . . ,v k son k soluciones independien- 
tes del sistema homogeneo T(x) — O, y si b es una solucion particular del sistema 
no homogeneo T(x) = c, entonces la solucion general del sistema no homogeneo es 

X = b + t l V 1 + • • ■ + t k v k , 

siendo t lt ... ,tk escalares cualesquiera. 

Este teorema no nos dice como encontrar una solucion particular b del sis¬ 
tema no homogeneo, ni las soluciones .v, ,... ,v k del sistema homogeneo. Nos dice 
tan solo lo que puede obtenerse cuando el sistema no homogeneo tenga una so¬ 
lucion. El siguiente ejemplo, aunque muy sencillo, ilustra el teorema. 

ejemplo. El sistema x 4- y = 2 tiene como sistema homogeneo asociado la 
ecuacion x + y = 0. Por consiguiente, el nucleo consta de todos los vectores de 
V 2 de la forma (/, —/), siendo t arbitrario. Puesto que (f, —t) = t( 1, —1), este es 
un subespacio uni dimensional de V 2 con base (1, —1). Una solucion particular 
del sistema no homogeneo es (0,2). Por tanto, la solucion general del sistema no 
homogeneo viene dada por 

(x,_y) = (0,2) + t(l, —1) o x = t, y — 2 — t, 
siendo t arbitrario. 


2.18 Tecnicas de calculo 

Volvamos al problema del calculo efectivo de las soluciones de un sistema 
lineal no homogeneo. Aunque se han desarrollado muchos metodos para atacar 
este problema, todos exigen calculos considerables si el sistema es de gran tama- 
no. Por ejemplo, para resolver un sistema de diez ecuaciones con el mismo numero 
de incognitas pueden ser necesarias varias horas de calculos, incluso con la ayuda 
de un calculador manual. 

Vamos a comentar un metodo muy utilizado, que se llama metodo de elimi- 
nacion de Gauss-Jordan, que es relativamente sencillo y puede programarse facil- 
mente para calculadores electronicos de aha velocidad. El metodo consiste en la 
aplicacion de tres operaciones fundamentales a las ecuaciones lineales del sistema: 

1) Intercambio de dos ecuaciones. 

2) Multiplicacion de todos los terminos de una ecuacion por un escalar no 
nulo. 

3) Suma de una ecuacion a otra multiplicada por un escalar. 
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Cada vez que efectuamos una de esas operaciones en el sistema obtenemos un 
nuevo sistema con las mismas soluciones. Dos sistemas con las mismas soluciones 
se llaman equivalentes. Efectuando esas operaciones una tras otra de modo siste- 
matico llegamos por fin a un sistema equivalente que puede resolverse a simple 
vista. 

Ilustraremos el metodo con algunos ejemplos particulares. Se vera entonces 
como se aplica el metodo en general. 

ejemplo 1. Sistema con solucion unica. Consideremos el sistema 

2x — 5y + 4z = — 3 
x — 2y + z — 5 
x — 4y + 6z = 10. 

Este sistema tiene solucion unica, x=124, y=75, z — 31, que obtendremos por el 
metodo de elimination de Gauss-lordan. Para evitar trabajo no copiamos las le- 
tras x, y, z ni los signos de igualdad, sino que trabajaremos con la matriz ampliada 


(2.24) 


'2 

-5 

4 

-3" 

1 

-2 

1 

5 

1 

-4 

6 

10 


obtenida al adjuntar los segundos miembros del sistema a la matriz de 
los coeficientes. Las tres operaciones basicas antes mencionadas se efectuan con 
las filas de la matriz ampliada y se llaman operaciones fila. En cualquier fase del 
proceso podemos poner las letras x, y, z e intercalar los signos de igualdad en las 
verticales correspondientes obteniendo ecuaciones. Nuestro objetivo es llegar a 


(2.25) 


'1 

0 

0 

124" 

0 

1 

0 

75 

0 

0 

1 

3!_ 


la matriz ampliada despues de una sucesion de operaciones fila. El correspondiente 
sistema de ecuaciones es x = 124, y = 75, z = 31, que nos da la solucion 
deseada. 
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El primer paso es obtener un 1 en el vertice superior izquierdo de la matriz. 
Podemos hacerlo intercambiando la primera fila de la matriz dada (2.24) con 
la segunda o con la tercera. O bien, podemos multiplicar la primera fila por 
Intercambiando las filas primera y segunda, obtenemos 


'1 

-2 

1 

5" 

2 

-5 

4 

-3 

_1 

-4 

6 

10 


El paso siguiente consiste en convertir todos los restantes elementos de la 
primera columna en ceros, dejando el primero intacto. Basta para ello multiplicar 
la primera fila por — 2 y sumar el resultado a la segunda fila. Luego multiplica- 
mos la primera fila por — 1 y sumamos el resultado a la tercera. Despues de esas 
dos operaciones, obtenemos 


(2.26) 


'1 

-2 

1 

5’ 

0 

-1 

2 

-13 

0 

-2 

5 

5_ 


Repetimos ahora el proceso en la matriz reducida 


~-l 2 

-13" 

-2 5 

5_ 


que 


aparece junto a los dos ceros. Podemos obtener 1 en su vertice superior izquierdo 
multiplicando la segunda fila de | ( 2.26) por — 1. Esto nos da la matriz 


'1 

-2 

1 

5' 

0 

1 

-2 

13 

0 

-2 

5 

5 


Multiplicando la segunda fila por 2 y sumando el resultado a la tercera, conse- 
guimos 


(2.27) 


‘1 

-2 

1 

5' 

0 

1 

-2 

13 

_0 

0 

1 

3! 


A1 llegar aqui, el correspondiente sistema de ecuaciones viene dado por 

x — 2y + z = 5 
y - 2z = 13 
z = 31 . 
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Estas ecuaciones pueden resolverse sucesivamente partiendo de la tercera y tra- 
bajando hacia atras, dandonos 

z = 31, y = 13 + 2z = 13 + 62 = 75, * = 5 + 2y - z = 5 + 150 - 31 = 124. 

O bien, podemos continuar el proceso de Gauss-Jordan convirtiendo en ceros 
todos los elementos situados por encima de la diagonal de unos en la segunda 
y en la tercera columnas. Multiplicando la segunda fila de (2.27) por 2 y su- 
mando el resultado a la primera, obtenemos 


‘l 

0 

-3 

31" 

0 

1 

-2 

13 

0 

0 

1 

31. 


Por ultimo, multiplicamos la tercera fila por 3 y sumamos el resultado a la primera 
fila, y luego multiplicamos la tercera fila por 2 y sumamos el resultado a la se¬ 
gunda con lo que llegamos a la matriz (2.25). 

ejemplo 2. Sistema con mas de una solucidn. Consideremos el siguiente 
sistema de 3 ecuaciones con 5 incognitas: 

2x — 5y + 4z + u — v — — 3 
(2.28) x — 2y + z — u + v - 5 

x — 4y + 6z + 2u — v — 10 . 

La correspondiente matriz ampliada es 


'2 

-5 

4 

1 

-1 

-3' 

1 

-2 

1 

-1 

1 

5 

.1 

-4 

6 

2 

-1 

10 


Los coeficientes de x,y,z y los segundos miembros son los mismos que los del 
ejemplo 1. Si efectuamos las mismas operaciones fila que en el ejemplo 1, llega¬ 
mos a la matriz ampliada 


"l 

0 

0 

-16 

19 

124" 

0 

1 

0 

-9 

11 

75 

0 

0 

1 

-3 

4 

31 
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El correspondiente sistema de ecuaciones puede resolverse respecto a x, y, z en 
funcion de u y v dandonos 

x = 124+ 16 u - 19v 
y = 75 + 9m — llv 
z — 31 + 3m — 4v . 

Si hacemos u — 1, y v = t 2 , siendo 1, y t, numeros reales arbitrarios, y determi- 
minamos x, y, z mediante esas ecuaciones, el vector (x, y, z, u, v) de V.-, dado por 

(x,y, z, m, v) = (124 + 16/j - 19t 2 , 75 + 9 1 1 - ll/ 2 , 31 + 3- 4r 2 , t 1 , t 2 ) 

es una solucion. Separando los terminos que contienen t l y t 2 , tendremos: 

(x,y,z, u, v) = (124, 75,31,0, 0) + q(16, 9, 3, 1,0) + r 2 (-19, -11, -4, 0, 1). 

Esta ecuacion nos da la solucion general del sistema. El vector (124, 75, 31, 0, 0) 
es una solucion particular del sistema no homogeneo (2.28). Los dos vectores 
(16, 9, 3, 1, 0) y ( — 19, —11, —4, 0, 1) son soluciones del correspondiente sis¬ 
tema homogeneo. Puesto que son independientes, constituyen una base para el 
espacio de todas las soluciones del sistema homogeneo. 

ejemplo 3. Sistema sin solucion. Consideremos el sistema 

2x — 5y + 4z = —3 
(2.29) x-2y+z= 5 

x — 4y + 5z = 10 . 

Es identico al del ejemplo 1 excepto que en el coeficiente de z en- la tercera ecua¬ 
cion ha sido cambiado el 6 por un 5. La matriz ampliada correspondiente es 

2-5 4 — 3~ 

1-21 5 . 

1 -4 5 10_ 

Aplicando las mismas operaciones fila usadas en el ejemplo 1 para transformar 
(2.24) en (2.27), llegamos a la matriz ampliada 


(2.30) 


1 -2 1 
0 1 -2 

0 0 0 


5 

13 

31 
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Cuando la ultima fila se expresa como ecuacion, llegamos a 0 = 31. Por consi- 
guiente el sistema original no tiene solucion puesto que los dos sistemas (2.29) 
y (2.30) son equivalentes. 

En cada uno de los ejemplos anteriores, el numero de ecuaciones no excedi'a 
al de incognitas. Si hay mas ecuaciones que incognitas, el proceso de Gauss- 
Jordan puede aun aplicarse. Por ejemplo, consideremos el sistema del ejemplo 1, 
que tiene la solucion x = 124, y -15, z- 31. Si adjuntamos una nueva ecua- 
cion a este sistema que sea satisfecha por la misma terna, por ejemplo, la ecua¬ 
cion 2x — 5y + z — 54, entonces el proceso de eliminacion nos lleva a la matriz 
ampliada 


"l 

0 

0 

124' 

0 

1 

0 

75 

0 

0 

1 

31 

_0 

0 

0 

0_ 


con una fila de ceros en la parte inferior. Pero si adjuntamos una nueva ecuacion 
que no se satisfaga por la terna (124, 75, 31), por ejemplo la ecuacion 
x + y + z — 1 , entonces el proceso de eliminacion nos conduce a la matriz 
ampliada de la forma 


"l 

0 

0 

124' 

0 

1 

0 

75 

0 

0 

1 

31 

_0 

0 

0 

a_ 


donde a 0. La ultima fila nos da una ecuacion contradictoria 0 = a lo que 
prueba que el sistema no tiene solucion. 


2.19 Inversas de matrices cuadradas 


Sea A = (an) una matriz cuadrada n X n, tal que BA — I, siendo I la ma¬ 
triz identidad n X n, entonces A se llama no singular y B la inversa de A por 
la izquierda. 

Elegida la base usual de los vectores coordenados unitarios de V„, sea 
T:V„ -> V„ la transformacion lineal con matriz m(T) = A. Tenemos entonces el 
siguiente 
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teorema 2.20. La matriz A es no singular si y solo si T es invertible. Si 
BA = I, entonces B = mCT' 1 ). 

Demostracion. Supongamos que A es no singular y que BA = I. Demostra- 
remos que T(x) = O implica x = O. Dado x tal que T(x) = O, sea X la matriz 
columna n X 1 formada a partir de los componentes de x. Puesto que T(x) = O, 
la matriz producto AX es una matriz columna n X 1 formada por ceros, asf que 
B(AX) es tambien una matriz columna de ceros. Pero B(AX) = (BA)X = IX = X, 
por lo que todo componente de x es 0. Por consiguiente, T es invertible, y la 
ecuacion TT 1 = I implica que m(T)m(r') — I o Am(T ~‘) = /. Multiplicando 
a la izquierda por B, encontramos = B. Reciprocamente, si T es invertible 
entonces T X T es la transformacion identica asf que m(T~')m(T) es la matriz 
identidad. Por consiguiente A es no singular y m(T~ l )A = I. 

Todas las propiedades de las transformaciones lineales invertibles tienen su 
contrapartida para las matrices no singulares. En particular, las inversas por la 
izquierda (si existen) son unicas, y toda inversa por la izquierda es tambien in- 
versa por la derecha. Dicho de otro modo, si A es no singular y BA = I, enton¬ 
ces AB = /. Llamamos a B la inversa de A y la designamos por A~\ La inver¬ 
sa A~ i tambien es no singular y su inversa es A. 

Seguidamente demostramos que el problema de la determination efectiva de 
los elementos de la inversa de una matriz no singular es equivalente a la resolu¬ 
tion de n sistemas lineales no homogeneos. 

Sea A = (a„) no singular y sea A~' — (6,,) su inversa. Los elementos de A 
y A -1 estan ligados por las n 2 ecuaciones. 

n 

(2.31) 2,a ik b kj = 6 i} . 

k= 1 


siendo da =1 si i = j, y = 0 si i ¥= j. Para cada valor fijo de /, podemos 
considerar (2.31) como un sistema no homogeneo.de n ecuaciones lineales con 
n incognitas , b 2 j, ■ ■ ■ , b„j. Puesto que A es no singular, cada uno de esos 
sistemas tiene solucion unica, la columna j de B. Todos esos sistemas tienen la 
misnia matriz de coeficientes A y difieren tan solo en sus segundos miembros. 
Por ejemplo, si A es una matriz 3X3, existen 9 ecuaciones en (2.31) que pueden 
representarse como 3 sistemas lineales que tienen las siguientes matrices ampliadas: 


fl ll 

a l2 

a l3 

r 


"an 

a iz 

@13 

O' 


"an 

@12 

@13 

0' 

a-n 

fl 22 

a Z3 

0 


a 21 

a Z2 

@23 

1 


@21 

@22 

@23 

0 

„ a 3l 

a 32 

a 33 

0_ 


_ a 31 

@32 

@33 

0 


_@31 

@32 

@33 

1 
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Si aplicamos el proceso de Gauss-Jordan, llegamos a las respectivas matrices am- 
pliadas 


‘1 

0 

0 

V 


"1 

0 

0 

to 

_1 


'1 

0 

0 

^13 

0 

1 

0 

^21 

, 

0 

1 

0 

^22 

> 

0 

1 

0 

^23 

_0 

0 

1 

^31_ 


0 

0 

1 

^32_ 


0 

0 

1 

^33_ 


En la practica aprovechamos el hecho de que los tres sistemas tienen la misma 
matriz de coeficientes y resolvemos los tres sistemas de una vez trabajando con 
la matriz ampliada 


"«11 

a 12 

a 13 

1 

0 

O' 

°21 

a 12 

a ‘2'.i 

0 

1 

0 

_ fl 31 

a 32 

a 33 

0 

0 

1 


El proceso de elimination nos lleva a 


'1 

0 

0 

bn 

bn 

b\z 

0 

1 

0 

bn 

^22 

b-i3 

0 

0 

1 

^31 

^32 

^ 33 _ 


La matriz de la parte derecha de la barra vertical es la inversa deseada. La de la 
izquierda es la matriz identidad 3X3. 

No es preciso conocer de antemano si A es no singular. Si A es singular, pode- 
mos aun aplicar el metodo de Gauss-Jordan, pero ocurre que en el proceso uno 
de los elementos de la diagonal se convierte en cero, y no sera posible transformar 
A en la matriz identidad. 


Un sistema de n ecuaciones lineales con n incognitas, esta representado por 


1 a ikX k = Ci , i'=l,2,. 


que se puede escribir, de una manera mas simple, como una ecuacion matricial 


AX = C, 


donde A = (au) es la matriz de los coeficientes, y X y C matrices columna, 
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"*r 


'c{ 


*2 


c 2 


• 

, c = 

• 




Sn. 


Si A es no singular, la unica solucion del sistema esta dada por X=A~ 1 C. 

2.20 Ejercicios 

Aplicando el proceso de Gauss-Jordan a cada uno de los sistemas siguientes, determinar 


la solucidn general, si 

existe. 





1 . 

X 

+ y + 3z = 

= 5 

5. 

3x 

— 2y + 5z + u = 1 



2x 

- y + 4z = 

= 11 


X 

+ y — 3z + 2u = 2 




-y + 

z = 

= 3. 


6x 

+ y - 4z + 3m = 7. 


2. 

3x 

+ 2_y + 

z 

= 1 

6. 

X 

+ y — 3z + u = 5 



5x 

+ 3v + 

3 z 

= 2 


2x 

— y + z — 2u — 2 



X 

+ y- 

z 

= 1. 


lx 

+ y — Iz + 3m = 3. 


3. 

3x 

+ 2_y + 

z 

= 1 

7. 

X 

+ y + 2z + 3 u + 4v 

= 0 


5x 

+ 3y + 

3 z 

= 2 


2x 

+ 2y + Iz + llu + 14t> 

= 0 


lx 

+ 4y + 

5 z 

= 3. 


3x 

+ 3_y + 6z + 10m + 15o 

= 0. 

4. 

3x 

4- 2_y + 

z 

= 1 

8. 

X 

— 2_y + z + 2m = — 2 



5x 

+ 3 y + 

3 z 

= 2 


2x 

+ 3_y — z — 5m = 9 



lx 

+ 4y + 

5 z 

= 3 


4x 

— y + z — u — 5 



X 

+ y- 

z 

= 0. 


5x 

— 3_y + 2z + m = 3. 


9. Demostrar 

• que el 

sistema x + y + 2z = 2, 

2x — 

y + 

3z = 2, 5x — y + az = 6, 

tiene so- 


lucion unica si a 5 * 8 . Hallar todas las soluciones cuando a — 8 . 
10. a) Determinar todas las soluciones del sistema 


5x + 2 y — 6z + 2m = — 1 
x — y + z — 11 = -2 . 

b) Determinar todas las soluciones del sistema 

5x + 2y — 6z + 2u = —1 
x - y + z - u — -2 
x + y + z — 6 . 


11. Este ejercicio nos indica c 6 mo se determinan todas las matrices no singulares 2x2. 
Demostrar que 
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~a 

b- 

~ d 

-b~ 

_c 

d_ 

_ —c 

a_ 


= (ad — bc)l. 


Deducir que 


[: 


r 

d_ 


es no singular si y solo si ad — be 7 * 0, en cuyo caso su inversa es 


1 

ad — be 


d 

—c 



Determinar la inversa de cada una de las matrices de Ics ejercicios del 12 al 16. 


12 . 


" 2 3 4" 
2 1 1 
-1 1 2 


13. 


14 . 



2 

1 

2 



'1 2 3 4" 

0 12 3 
0 0 1 2 ' 

.0 0 0 1 . 

""0 10 0 0 0 "" 

2 0 2 0 0 0 

0 3 0 1 0 0 

0 0 1 0 2 0 

0 0 0 3 0 1 

0 0 0 0 2 0 


2.21 Ejercicios varios sobre matrices 

1. Si una matriz cuadrada tiene una columna de ceros o una fila de ceros, demostrar que 
es singular. 
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2. Para cada una de las proposiciones siguientes relativas a matrices n X n, dar una de- 
mostracion o un contraejemplo. 

a) Si AB + BA = O, entonces A 2 B 3 = B 3 A 2 . 

b) Si A y B son no singulares, entonces A + B es no singular. 

c) Si A y B son no singulares, entonces AB es no singular. 

d) Si A, B, y A + B son no singulares, entonces A — B es no singular. 

e) Si A 3 = O, entonces A — I es no singular. 

f) Si el producto de k matrices A 1 ... At es no singular, cada una de las matrices A,- es 
no singular. 



n 2i 

r 

3. Si A = 

i 

Ui 

i_ 

, hallar una matriz no singular P tal que P~ 1 AP = 


0" 

-1 


4. La matriz A — 


a i 
i b 


donde P = -1, a = J(1 + Vs), y b = |(1 - V5), tiene la 


propiedad de que A 2 = A. Describir en forma completa todas las matrices A, 2 x 2, 
con elementos complejos tales que A 2 = A. 

5. Si A 2 = A, demostrar que (A + I) k = / + ( 2 k — 1)A. 

6 . La teorfa de la relatividad utilizaun conjunto de ecuaciones de la forma x = a(x — vt), 
y' — y, z' = z, f = a(t — vx/c 2 ). Aqui v representa la velocidad de un objeto que se 
mueve, c la velocidad de la luz, y a — cj \ c 2 — v 2 , donde r < c. La transformacion 
que aplica el vector bi dimensional (x, t) en (*', t') se llama transformacion de Lorentz. 
Su matriz relativa a las bases usuales se designa con L(,v) y viene dada por 


L(v) = a 


1 


—vc~ 2 



7. 


Observese que L(v) es no singular y que L(0) = /. Demostrar que L(v)L(u) — L(w), 
siendo w = (m + v)c 2 /(uv + c 2 ). Es decir, el producto de dos transformaciones de 
Lorentz es otra transformacion de Lorentz. 

Si cambiamos las filas por las columnas en una matriz rectangular A, la nueva matriz 
asi obtenida se llama la transpuesta de A y se designa por A*. Por ejemplo, si tenemos 


A = 


A 

4 


2 3' 
5 6 


entonces A ‘ — 


1 

2 

3 


4' 

5 

6 


8 . 


9 . 


Demostrar que las transpuestas tienen las propiedades siguientes: 
a) (A 1 ) 1 = A. b) (A + By = A‘ + BK c) (cA) 4 = cAK 

d) (ABY = B ( A l . e) (A 4 )" 1 = (A^ 1 ) 4 si A es no singular. 

Una matriz cuadrada A se llama matriz ortogonal si AA 4 = I. Comprobar que la maftriz 
f cos 0 — sen (tl 


2x2 ,, I es ortogonal para cada numero real 0. Si A es cualquier 

|_&en u COS u _J 

matriz ortogonal n X n, demostrar que sus filas, consideradas como vectores de V„, for 
man un conjunto ortogonal. 

Para cada una de las proposiciones siguientes acerca de las matrices n X n, dar una 
demostracion o en su lugar un contraejemplo. 
a) Si A y B son ortogonales, A + B es ortogonal. 
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b) Si A y B son ortogonales, AB es ortogonal. 

c) Si A y AB son ortogonales, B es ortogonal. 

10. Matrices de Hadamard, llamadas as( por Jacques Hadamard (1865-1963), son aquellas 
matrices n X n con las propiedades siguientes: 

I. Cada elemento es 1 6 —1. 

II. Cada fila, considerada como un vector de V„, tiene longitud igual a \/'n . 

III. El producto escalar de dos filas distintas cualesquiera es 0. 

Las matrices de Hadamard se presentan en ciertos problemas de geometria y en la 
teoria de ntimeros, y han sido aplicadas recientemente en la codification 6ptima para la 
comunicacion espacial. A pesar de su aparente simplicidad, presentan muchos problemas 
sin resolver. El principal problema no resuelto en este momento es el de determinar todos 
los valores de n para los que existe una matriz de Hadamard n X n. Este ejercicio da 
idea de una solution parcial. 

a) Determinar todas las matrices de Hadamard 2x2 (hay exactamente 8). 

b) Esta parte del ejercicio esboza una demostracion sencilla del siguiente teorema: 
Si A es una matriz de Hadamard n x n, siendo n > 2, entonces n es un multiplo de 4. 
La demostracion se basa en dos lemas muy sencillos relativos a los vectores en el espa- 
cio de dimension n. Demostrar cada uno de esos lemas y aplicarlos a las filas de la 
matriz de Hadamard para demostrar el teorema. 


lema 1. Si X, Y, Z son vectores ortogonales de V„, se tiene 
(X+ Y)-(X+Z)= ||X|| 2 . 

lema 2. Pongase X — (x, ...., x„), Y = (y x , ..., y„), Z - (z 1 ,. .., z„). 
Si cada componente x,, y„ z, es 1 o — 1, el producto (x, + y,)(x, + z,) es 0 6 4. 
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DETERMIN ANTES 


3.1 Introduction 


En numerosas aplicaciones del Algebra lineal a la Geometria y al Analisis 
el concepto de determinante desempena un papel importante. Este capitulo estudia 
las propiedades fundamentales de los determinantes y algunas de sus aplicaciones. 

En el Volumen I se introdujeron los determinantes de segundo y tercer orden 
como una notation util para expresar ciertas formulas en forma compacta. Re- 
cordemos que el determinante de segundo orden se definio mediante la formula 


(3.1) 


— a n a n a \iPzi • 


a n O 12 
a n o 2 2 

A pesar del parecido de las notaciones, el determinante 


a n a n 

°il °22 


(escrito con 


dos barras verticales) es conceptualmente distinto de la matriz 


a u a l2 

_ a 21 O22J 


(con 


dos corchetes). El determinante es un numero asignado a la matriz y que se 
calcula con la formula (3.1). Para acentuar esta conexion tambien escribimos 


(3.2) 


a n a n 
a 21 O 22 


= det 


On a 12 

L fl 21 a 22 . 


Los determinantes de tercer orden se definieron en el Volumen I en funcion 
de determinantes de segundo orden mediante la fdrmula 

a n O12 Oi{\ 

I a 21 O 22 I 


det 


On On a i3 
Pn a 32 a 33 


= On 


°22 0 23 
o 3i a 33 


On 


°21 022 
Oil o 33 


+ Ois 


a 31 0 33 
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Este capi'tulo considera el caso mas general, el determinante de una matriz cua- 
drada de orden n para cualquier entero n ^ 1. Nuestro punto de vista consiste en 
tratar el determinante como una funcion que asigna a cada matriz cuadrada A 
un numero llamado determinante de A y que se indica por det A. Se puede definir 
esa funcion por medio de una formula que generaliza (3.1) y (3.2). Tal formula 
es una suma que contiene n\ productos de elementos de A. Para valores grandes 
de n esa formula es de diffcil manejo y se usa poco en la practica. Es preferible 
estudiar los determinantes desde otro punto de vista que ponga de manifiesto con 
mayor claridad sus propiedades esenciales. Tales propiedades, importantes en 
las aplicaciones, se tomaran como axiomas para definir una funcion determinante. 
En principio, nuestro plan constara de tres partes: 1) JustificarTa eleccion de los 
axiomas. 2) Deducir otras propiedades de los determinantes a partir de los axio¬ 
mas. 3) Demostrar que existe una funcion y solo una que satisfaga a tales 
axiomas. 

3.2 Justificacion de la eleccion de los axiomas para una funcion determinante 

En el Volumen I se demostro que el producto mixto de tres vectores 
/4j , A 2 , A s en E a puede expresarse como el determinante de una matriz cuyas 
filas son los vectores dados. Asi tenemos 



a n 

a \2 

fl 13 

Ai x A 2 • A 3 = det 

a 21 

d 32 

fl 23 


_ fl 31 

fl 32 

a 33_ 


donde A x — (a n , a 12 , a 13 ), A 2 — (a 2 j, a 22 , a 23 ), i y A 3 — (a 31 , a 32 , a 33 ). 

Si las filas son linealmente independientes el producto mixto no es nulo; 
el valor absoluto del producto es igual al volumen del paralelepfpedo determinado 
por los tres vectores A x , A 2 , A 3 . Si las filas son linealmente dependientes el pro¬ 
ducto mixto es nulo. En tal caso A t , A 2 , A 3 son coplanarios y el paralelepipedo 
degenera en una figura plana de volumen nulo. 

Algunas de las propiedades del producto mixto justifican la eleccion de los 
axiomas para una funcion determinante en el caso n-dimensional. Para establecer 
esas propiedades en forma apta para la generalizacion, consideramos el producto 
mixto^ como una funcion de los tres vectores fila A 1 , A 2 , As ■ Designamos esta 
funcion por d; asf pues. 


d(A i, A 2 , A 3 ) — Ai x A 2 ' A 3 . 
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Centremos nuestra atencion en las propiedades siguientes: 

a) Homogeneidad en cada fila. Por ejemplo, la homogeneidad en la primera 
fila establece que 

< i(tA 1 , A g , A 3 ) = t d(A 1 , A 2 , A 3 ) para todo escalar t. 

b) Aditividad en cada fila. Por ejemplo, la aditividad en la segunda fila 
Significa que 


d(A 1 , A 2 + C, A 3 ) — d(A lt A 2 , A 3 ) + d(A lt C, A 3 ) 


para todo vector C. 

c) El producto mixto es nulo si dos de las filas son iguales. 

d) Normalizacidn: 


d(i,j, k) = 1, donde i = (1, 0, 0), j = (0,1,0), k = (0, 0, 1) 

Cada una de esas propiedades puede comprobarse facilmente a partir de las 
propiedades de los productos escalar y vectorial. Algunas son sugeridas por la 
relacion geometrica entre el producto mixto y el volumen del paralelepipedo de- 
terminado por los vectores geometricos A lt A 2 ,A 3 . El significado geometrico 
de la propiedad aditiva b) en un caso particular es de especial interes. Si toma- 
mos C = Ai en b) el segundo termino del segundo miembro es cero en virtud 
de c), y la relacion b) se transforma en 

(3-3) d(A 3 , A 2 + Aj , A 3 ) = d(Ai, A 2 , A 3 ). 


Volumen = d(AA ,, A :1 ) Volumen = d(A ,,/), + A,, A :! ) 



Figura 3.1 

Interpretacion geometrica de la propiedad d(A t A 2 , A,) = d(A u A, + A 2 , /t 3 ). Los dos 
paralelepipedos tienen volumenes iguales. 
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Esta propiedad se pone de manifiesto en la figura 3.1 que representa un paralele- 
pipedo determinado por A,. ,A 2 ,A 3 , y otro determinado por Ai, A, + A 2 , A 3 ■ 
La igualdad (3.3) establece que esos dos paralelepipedos tienen volumenes iguales. 
Geometricamente ello es evidente ya que los paralelepipedos tienen alturas iguales 
y bases de igual area. 

3.3 Conjunto de axiomas que definen una funcion determinante 

Las propiedades del producto mixto mencionadas en la seccion anterior 
pueden generalizarse con facilidad y utilizarse como axiomas para determinantes 
de orden n. Si A = (an) es una matriz n X n con elementos reales o complejos, 
designemos sus filas por A lt ..An. As i, la fila i-esima de A es un vector en E„ 
dado por 


Ai — (flii, o,- 2 ,.. . , a in ). 

Consideremos el determinante como una funcion de las n filas Ax,... ,A n y de¬ 
signemos su valor por d(A x ,..., A„) o por det A. 

DEFINICION AXIOMATICA DE UNA FUNCI6N DETERMINANTE. Una funcion COK 
valores reales o complejos d, definida para cada n componentes ordenadas de 
los vectores Ai,.... A„ en E», se denomina funcion determinante de orden n 
si satisface los siguientes axiomas cualesquiera que sean los vectores Ai,. .., A n 
y C en E n : 

axioma 1. homogeneidad en cada fila. Si se multiplica la k-esima fila 
Ak por un escalar t, el determinante queda tambien multiplicado por t: 

d(... , tA k ,...) — t d(... , A k ,...). 

axioma 2. aditividad en cada fila. Para cada valor de k tenemos 
d(A lt . .. , A k + C,, A n ) = d(Ai,... , A k ,.. . , A „) + d(A k ,.. . , C,... , A n ) 

axioma 3. el determinante se anula si dos filas cualesquiera son 
iguales: 

d(Ai,..., A„) = 0 si Ai = Aj (para ciertos i y j tales que i ¥= j.) 

AXIOMA 4. EL DETERMINANTE DE LA MATRIZ IDENTIDAD ES IGUAL A 1: 

d(h 1, siendo h el k-esimo vector coordenado unidad . 
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Los dos primeros axiomas establecen que el determinante de una matriz es 
una funcidn lineal de cada una de sus filas. Con frecuencia esto se expresa di- 
ciendo que el determinante es una funcidn multilineal de sus filas. Aplicando 
reiteradamente la linealidad a la primera fiia podemos escribir 

d {2 ’ -^2.J t k d(C k , A 2 ,, A n ), 

\*=i / *=i 

siendo h ,... ,t p escalares y ,... ,C P vectores cualesquiera de E„. 

A veces se utiliza una version particular del axioma 3: 

AXIOMA y. EL DETERMINANTE SE ANULA SI DOS FILAS CONSECUTIVAS SON 
IGUALES: 

d(A lt ... , AJ = 0 si A k = A k+1 para un cierto k = 1,2,... ,n — 1. 

Se demuestra mas adelante que para un n dado existe una y sdlo una funcidn 
d que satisface los axiomas 1, 2, 3' y 4. El teorema que sigue da unicamente las 
propiedades de los determinantes deducidas a partir de los axiomas 1, 2, y 3'. 
Una de esas propiedades es el axioma 3. Se observara que el axioma 4 no se 
utiliza en la demostracion de este teorema. Tal observacion sera de utilidad mas 
adelante cuando demostremos la unicidad de la funcidn determinante. 

teorema 3.1. Una funcidn determinante que satisfaga los axiomas 1, 2, y 
y tiene ademas las siguientes propiedades: 

a) El determinante se anula si alguna fila es O: 

d(A x ,..., A„) = 0 si A k = O para algun k. 

b) El determinante cambia de signo si se intercambian dos filas consecutivas: 

d(. • • , A k , A k+1 ,...)— —d(..., A k+1 , A k ,...). 

c) El determinante cambia de signo si dos filas cualesquiera A, y A, con 
i ¥= j se intercambian. 

d) El determinante se anula si son iguales dos filas cualesquiera: 

d(Aj,..., A„) = 0 si Ai = Aj para un par i, j, con i¥= j . 

e) El determinante se anula si sus filas son linealmente dependientes. 
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Demostracion. Para demostrar a) tomemos simplemente t = 0 en el axio- 
ma 1. Para demostrar b), sea B una matriz que tenga las mismas filas que A 
excepto las filas k y k + 1. Sean las filas Bk y B* +1 iguales a Ak + A*+,. Enton- 
ces segun el axioma 3' det B = 0 . Asf podemos escribir 

... A k -f- A kJrX , Aft -f* Aft^ ,...) — 0. 

Aplicando la propiedad aditiva a las filas k y k + 1 podemos escribir esa igualdad 
en la forma: 


d(- Aft, Aft,...) + d(.Aft, A k+1 ,...) + d(... , A k+1 , A k ,...) 

+ d(... , A k+1 , A k+1 ,...) = 0. 

Los terminos primero y cuarto son nulos en virtud del axioma 3'. Luego el segun 
do y tercer terminos son opuestos, lo que demuestra b). 

Para demostrar c) podemos suponer que i < j. Se pueden intercambiar las 
filas Ai y Aj efectuando un numero impar de transposiciones de filas consecutivas. 
Primero transponemos la fila A/ sucesivamente con las filas A,-_, , A,_ 2 ,..., A,. 
Esto exige j — i transposiciones. Luego la fila A,- la transponemos sucesivamente 
con las filas A i+1 , A, +2 ,. .., A,_i. Esto supone j — i — 1 transposiciones. Cada 
transposicion o intercambio de filas consecutivas invierte el signo del determi- 
nante. El numero total de cambios de signo es pues (/—/) + (/—r— 1)=2(/ — *) — 1 
que es un numero impar, lo que demuestra c). 

Para demostrar d), sea B la matriz obtenida invirtiendo en A las filas A, 
y A, . Puesto que A, = A,-, se tiene B = A y por tanto detB = det A. Pero, 
segun c) det B = — det A . Por consiguiente det A = 0. 

Para demostrar e) supongamos que existen los escalares Ci..... c* , no todos 
nulos, tales que 2?=i <V4 = O. Entonces toda fila Ak con Ck ^ 0 puede expre- 
sarse como combinacion lineal de otras filas. Para mayor sencillez, supongamos 
que Ai es combinacion lineal de las otras, por ejemplo A x = 4 A k . En virtud 

de la linealidad de la primera fila tenemos 


d(A j, A 2 , 


1 n) = d(i 

\k= S 


tkAft , Aj, 


0 =hkd(A k , 

] k= 2 


Ai > • • ■ . A„). 


Pero cada termino d(Au , A 2 ,..., A„) de la ultima suma es cero ya que Ak es 
igual por lo menos a una de las filas A 2 ..... A« . Luego toda la suma es cero. 
Si la fila A, es una combinacion lineal de las otras filas, razonamos en forma 
analoga, utilizando la linealidad en la fila i. Esto demuestra e). 
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3.4 Calculo de determinantes 


A1 llegar aquf puede ser instructive calcular algunos determinantes, utilizan- 
do tan solo los axiomas y las propiedades del teorema 3.1, suponiendo siempre 
que las funciones determinantes existen. En cada uno de los ejemplos que siguen 
no aplicamos el axioma 4 hasta ei final del calculo. 

ejemplo 1. Determinante de una matrix 2x2. Queremos demostrar que 


(3.4) 



<*12 


— a ll fl 22 — a \l a U ■ 


L«ai 022 J 

Escribamos los vectores fila como combinaciones lineales 
nados unitarios i = (1,0) y j = (0, 1): 


de los vectores coorde- 


— (011> 012) — 011* 4" 012 J> A 2 — (021 > 022) — 021* + 022/ • 


Utilizando la linealidad en la primera fila tenemos 


d(A x , A 2 ) = d(a n i + a 12 j, A 2 ) = a n d(i, A 2 ) + a 12 d(j, A 2 ). 


Utilizandola nuevamente en la segunda fila se obtiene 


d(i, A 2 ) = d(i, a 21 i + a 2i j) = a 21 d(i, i) + a 22 d(i,j) = a 22 d(i,j), 


puesto que d(i,i) =0. Del mismo modo encontramos 


d(j, A 2 ) = d(j, a n i + a 22 j) = a 21 d(j, i ) = — a 21 d(i,j). 
Por tanto obtenemos 


d(A 1 , A 2 ) — (0ii022 0i2**2i) A(i,j). 

Pero d(i,j) = 1 segun el axioma 4, con lo que d{A x , A 2 ) = a lx a 22 - a 12 a 21 como 
se afirmo. 

Este razonamiento demuestra que si una funcion determinante existe para 
las matrices 2X2, debe tener necesariamente la forma (3.4). Reciprocamente, 
es facil comprobar que esa formula define, efectivamente, una funcion determi¬ 
nante de orden 2. Por consiguiente hemos demostrado que existe una y solo una 
funcion determinante de orden 2. 
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ejemplo 2. Determinante de una matriz diagonal. Una matriz cuadrada 
de la forma 


«ii 0 


A = 


0 #22 

0 0 


0 _ 
0 


se denomina matriz diagonal. Cada elemcnto ay no perteneciente a la diagonal 
principal, (i ¥= j ) es cero. Vamos a demostrar que la determinante de A es igual 
al producto de los elementos pertenecientes a la diagonal 

(3.5) det A = # n a 22 •••#„„. 

La fila k de A es el producto de un escalar por el fc-esimo vector coordenado 
unidad, A k — a kk h . 

Aplicando repetidamente la propiedad de homogeneidad llegamos a 


det A — d{A 1 9 ... , A n ) • d{a k \I \,. * * )*fl nB f B ) flu * * * # nn > • • • > f n ) * 
Esta formula puede escribirse en la forma 


det A = a n - ■ ■ a nn det I, 

en donde I es la matriz identidad. El axioma 4 nos dice que det / = 1, con lo que 
obtenemos (3.5). 

ejemplo 3. Determinante de una matriz triangular superior. Una matriz 
cuadrada de la forma 


U> 


Mil m 12 
0 #22 


0 0 


*1 n 


■ m 2b 


se llama matriz triangular superior. Todos los elementos situados por debajo de 



Calculo de determinantes 


95 


la diagonal principal son nulos. Vamos a demostrar que el determinante de una 
tal matriz es igual al producto de los elementos de la diagonal principal, 

det U = M n M 22 ■■■u nn . 

Demostramos primero que det U = 0 si algun elemento uu de la diagonal 
principal es uu = 0. Si el ultimo elemento de esa diagonal u m es cero, la ultima 
fila es O y det U = 0 en virtud del teorema 3.1 a). Supongamos, ahora, que sea 
nulo algun elemento un (no precisamente el u„„). Sea por ejemplo u 22 — 0. Enton- 
ces cada uno de los n — 1 vectores fila U 2 ,... ,U„ tienen sus dos primeros com- 
ponentes nulos. Por tan to esos vectores generan un subespacio cuya dimension 
es por lo menos n— 2. De ahl que esas n— 1 filas (y por tanto todas las filas) sean 
linealmente dependientes. Segun el teorema 3.1 e), det U — 0. Del mismo modo 
se demuestra que det U — 0, si es cero cualquier elemento de la diagonal prin¬ 
cipal. 

Vamos a demostrar ahora el caso general. Escribamos la primera fila U x como 
una suma de dos vectores-fila. 


v 1 = v 1 + Vi, 


siendo V a = [« u , 0 ,..., 0] y Vi = [0, u n ,..., « w ]. En virtud de la linea- 
lidad en la primera fila tenemos 


det U = det (V,, U . U n ) + det (Vi, U„ ..., U n ). 

Pero det(Vj, U 2 ,..., U„) = 0 ya que este es el determinante de una matriz 
triangular superior con un elemento nulo en la diagonal principal. Luego tenemos 

(3.6) det U — det (F x , U z ,... , UJ). 

Tratemos ahora el vector-fila U 2 en forma analoga, expresandolo como una suma, 


siendo 


U t =V 2 + Vi, 


V 2 = [0, u 22 , 0,.. . , 0] y Vi = [0, 0, u 23 , . . ., u 2n ]. 

Hagamos esto en el segundo miembro de (3.6) y apliquemos la linealidad en la 
segunda fila con lo que obtenemos 

det U = det (V lt V t , U 3 . U n ), 


(3.7) 



96 


Determinantes 


ya que deRV, ,V ' 2 ,U 3 ,..., U„) = 0. Repitiendo el razonamiento para cada una 
de las filas que siguen en el segundo miembro de (3.7) obtenemos finalmente 

detU = det(V 1 ,V 2 ,...,V n ), 

donde (V\ , V 2 ,■. ■, V „) es una matriz diagonal con los mismos elementos que U 
en la diagonal principal. Por consiguiente, segun el ejemplo 2, tenemos 


det U = u n u 22 


como deseabamos demostrar. 

ejemplo 4. Calculo por el metodo de Gauss-Jordan. El metodo de elimi- 
nacion de Gauss-}ordan para resolver sistemas de ecuaciones lineales es tambien 
uno de los mejores metodos para el calculo de determinantes. Recordemos que 
el metodo consiste en la aplicacion de tres tipos de operaciones a las filas de la 
matriz: 

1) Transposition de dos filas. 

2) Multiplication de todos los elementos de una fila por un escalar no nulo. 

3) Adicion a una fila del producto de otra por un escalar. 

Efectuando una y otra vez esas operaciones de manera sistematica podemos trans- 
formar cualquier matriz cuadrada A en una matriz triangular superior U cuyo 
determinante sabemos ya calcular. Es facil determinar la relation entre det A 
y det U. Cada vez que se realiza la operacion 1) el determinante cambia de signo. 
Cada vez que se efectua 2) con un escalar c¥= 0, el determinante se multiplica 
por c. Si se efectua 3) el determinante no varia. Por consiguiente, si la operacion 1) 
se efectua p veces y si c x ,. . . ,c q son los factores escalares que se utilizan en 
la operacion 2), se tiene 

(3.8) det A = (- l) p (c 1 c 2 • • • c,)" 1 det U. 

Observemos nuevamente que esta formula es consecuencia tan solo de los tres 
primeros axiomas. Su demostracion no depende del axioma 4. 

3.5 El teorema de unicidad 

En el ejemplo 3 de la seccion anterior se demostro que los axiomas 1, 2, y 3 
implican la formula det U — u n u&... u m det I. Combinando esta con (3.8) vemos 
que para toda matriz A,nXn, existe un escalar c (que depende de A) tal que 


(3.9) 


d ( A i . A) = cd(I x ,... ,/„). 



Ejercicios 


97 


Ademas, esta formula es consecuencia unicamente de los axiomas 1, 2 y 3. A partir 
de este resultado facilmente podemos demostrar que no puede existir mas de 
una funcion determinante. 

TEOREMA 3.2. TEOREMA DE UNICIDAD PARA LOS DETERMINANTES. Sea d 
una funcion que satisfaga los cuatro axiomas que caracterizan una funcion deter¬ 
minante de orden n, y sea f otra funcion que satisfaga los axiomas 1, 2 y 3. En- 
tonces, elegido un sistema cualquiera de vectores Ai,. . ., A n del espacio n-di- 
mensional tenemos 

(3.10) f(A lt ...,A n ) = d(A lt A n )f(I t ,. 

En particular, si f satisface tambien el axioma 4 tenemos f(A t ,. . . , A„) = 
— d(A l , ... , A n ). 

Demostracion. Sea g( A u A„) = f(A 1 ,A n )— dfA^ ..., A„)f{U, ..., /„). 
Demostraremos que g(Ai, ...,A„) = 0 cualesquiera que sean A u ...,A„. Puesto que 
d y / satisfacen ambas los axiomas 1, 2 y 3 lo mismo le ocurre a g. Luego g tam¬ 
bien satisface la ecuacion (3.9) ya que esa se dedujo a partir de los tres primeros 
axiomas exclusivamente. Podemos escribir por tanto 

(3.11) g(A x ,.. . , A n ) = cgiE, . . . , /„), 

en donde c es un escalar que depende de A. Tomando A = I en la definicion 
de g y teniendo en cuenta que d satisface el axioma 4 encontramos 

g( 4,.... 4) =/(4,..., 4) -/(4, • • -, 4) = 0. 

Por consiguiente, la ecuacion (3.11) se convierte en g (1 .... , A,,) = 0. Esto 
completa la demostracion. 


3.6 Ejercicios 

En este conjunto de ejercicios debe suponerse la existencia de una funcion determinante. 
Los determinantes de orden 3 pucden calcularsc con la formula (3.2). 

1. Calcular cada uno de los determinantes siguientes. 



2 

1 

1 


3 

0 

8 


a 

1 

0 

a) 

1 

4 

-4 

b) 

5 

0 

7 

, c) 

2 

a 

2 


1 

0 

2 


-1 

4 

2 


0 

1 

a 
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x 


2 . 


Si det 


3 

1 


y 

o 

l 


z 


2 

1 


= 1, calcular el determinante de cada una de las matrices siguientes: 



2x 


2z" 


1 

X 

V 

N 

_1 



~x — 1 y - 1 z - r 

a) 

3 

2 

0 

1 

b) 

3x + 3 3 y 3z + 2 

» 

c) 

4 1 3 


1 

1 

1 


x + 1 y + 1 z + 1 



1 1 1 


3. a) Demostrar que 


1 1 1 

a b c 


= (b — a)(c — a)(c — b ). 


a 3 b 3 c 2 


b) Hallar las correspondientes formulas para los determinantes 


1 

i 

1 


l 

1 

1 

a 

b 

c 

y 

a 3 

b 3 

c 3 

a 3 

b 3 

c 3 


a 3 

b 3 

c 3 


4. Calcular los determinantes de cada una de las siguientes matrices transformando cada 
una de ellas en una matriz triangular superior. 


a) 


'1 -1 

i r 


’1 

i 

i 

1" 


*1 

i 

1 

1" 

1 -1 

-l -l 

, b) 

a 

b 

c 

d 

, c) 

a 

b 

c 

d 

1 1 

-l -l 

d 2 

b 3 

c 3 

d 3 

a 3 

b 3 

c 2 

d 3 

_1 1 

i -i. 



b 3 

c 3 

d\ 


a 4 

6 4 

c 4 

d\ 



p 


i 

1 

1 1 

n 





d) 


'a 1 0 0 O' 
4 a 2 0 0 
0 3 a 3 0 
0 0 2 a 4 
0 0 0 1 a 


1 1 1 

1 1 -1 

1 -1 -1 

1 -1 1 

1 -1 -1 


-1 -1 

-1 1 

1 -1 

-1 1 

1 1 


-1 

1 

1 

1 

-1 


5. Una matriz triangular inferior A = (a„) es una matriz cuadrada que tiene nulos todos 
los elementos situados por encima de la diagonal principal; esto es, = 0 siempre que 
i < j. Demostrar que el determinante de una tal matriz es igual al producto de los 
elementos de la diagonal principal: det A = a n aa ... a„„. 
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6 . Sean j\,U,g\,gi cuatro funciones derivables en tm intervalo ( a,b ). Se define 


F{x) = 


AW AW 

glix) gz(x) 


para cada x de (a, b). Demostrar que 


F\x) 


AW f’ t ix) 

gi(x) gzix) 


AW 

g'i(x) 


fiix) 

g'zix) 


7. Establecer y demostrar una generalizacion del ejercicio 6 para el determinante 


Fix) = 


AW AW AW 

glix) g 2 ix) g 3 (x) 

AW hix) AW 


8 . a) Si 


AW AW 
A'W A'W 


, demostrar que F\x) = 


AW 

A'W 


AW 

A'W 


b) Establecer y demostrar un resultado analogo para determinantes 3x3, suponiendo 
la validez de la ecuacion (3.2). 

9. Sean U y V dos matrices triangulares superiores »xn. 

a) Demostrar que U + V y UV son matrices triangulares superiores. 

b) Demostrar que det (UV) = (det U)(det V). 

c) Si det U 5*0 demostrar que existe una matriz triangular superior U~‘ tal que UU '—I, 
y deducir que det(C/~‘) = 1 /det U. 

10. Calcular det A, det (A 1 ), y A -1 para la siguiente matriz triangular superior: 


A = 


‘2 

0 

0 

0 


3 

2 

0 

0 


4 

3 

2 

0 


5' 

4 

3 

2 _ 


3.7 Producto de determinantes 


En esta seccion utilizamos el teorema de unicidad para demostrar que el 
determinante del producto de dos matrices cuadradas es igual al producto de 
sus determinantes. 


det (AB) = (det A)(det B ), 
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Recordemos que el producto AB de dos matrices A = (a,,-) y B = (bn) es la 
matriz C = (c,,) cuyo elemento ij viene dado por la formula 


a 

( 3 . 12 ) c i j — ^Qixbkj- 

Jc= 1 

El producto esta definido unicamente si el numero de columnas del factor de la 
izquierda A es igual al numero de filas del factor de la derecha B. Esto ocurre 
si A y B son matrices cuadradas del mismo orden. 

En la demostracion de la formula para el producto se hace uso de una 
sencilla relacion que existe entre las filas de AB y las de A. La establecemos como 
un lema. Como de costumbre, designamos con A t la fila i de la matriz A. 

lemA 3.3. Si A es una matriz mXn y B una matriz nXp, se tiene 


(AB)i = AiB. 


Esto es, la fila i del producto AB es igual al producto de la fila Ai por B. 

Demostracion. Designemos con B’ la columna j de B y sea C = AB. En- 
tonces la suma (3.12) puede considerarse como el producto escalar de la fila i 
de A por la columna / de B, 


c ti — A t • B j . 

Por tanto la fila i, C,-, es la matriz fila 

Q = [A i -B\A i -B\...,A i -B»], 

Pero esta es tambien el resultado de la multiplicacion de la matriz fila At por B, 
ya que 


A t B = \r n ,... , a in ] 


bn b 12 


1_ b n \ b n2 


J lv 


= [A t - 


Por consiguiente C, = AS, lo que demuestra el lema 



Determinante de la matriz inversa de una matriz no singular 


101 


teorema 3.4. f6rmula para multiplicar determinantes. Para dos ma¬ 
trices nXn cualesquiera A y B tenemos 

det ( AB ) = (det ^4)(det B). 

Demostracidn. Puesto que (AB), = A,B, tenemos que demostrar que 

d{A x B, ..., A n B) = d(A x ,.... A n )d(B 1 , ...,B n ). 

Volviendo a utilizar el lema tambien tenemos B, = (IB), = hB, donde / es la 
matriz identidad n X n. Por consiguiente d(Bi,,B„) — d(I i B ,..., I„B), y te¬ 
nemos que demostrar que 

d(A,B,..., A n B) = d(A x ,A n ) d^B,..., I n B). 

Mantengamos B fija e introauzcamos una funcion / defmida por la formula 

f(A 1 ,...,A„) = d(A 1 B,...,A n B). 

La igualdad que deseamos demostrar establece que 
(3.13) f(A i, ...,A n ) = d(A lt ..., A n )f(l u 

Es ahora asunto facil comprobar que / satisface los axiomas 1, 2 y 3 relativos a 
una funcion determinante, con lo que, en virtud del teorema de unicidad, la 
igualdad (3.13) es valida para cualquier matriz A. Esto completa la demostracidn. 

En las dos seccciones que siguen se exponen aplicaciones de la formula del 
producto. 

3.8 Determinante de la matriz inversa de una matriz no singular 

Recordemos que una matriz cuadrada A se llama no singular si tiene una 
inversa B por la izquierda tal que BA = I. Si existe una inversa por la izquierda 
es unica y es tambien inversa por la derecha, AB — I. Designemos la inversa por 
A~\ La relacion entre det A y det A -1 es la que podia esperarse. 

teorema 3.5. Si una matriz A es no singular, entonces det A=A 0 y tenemos 

1 

det A 


(3.14) 


det A 1 
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Demostracion. Segun la formula del producto tenemos 
(det y4)(det A~ x ) = det (AA* 1 ) — det / = 1. 

Luego det A ¥= 0 y (3.14) es cierta. 

El teorema 3.5 demuestra que la no anulacion de det A es una condicion ne- 
cesaria para que A sea no singular. Mas adelante demostraremos que esa con¬ 
dicion es tambien suficiente. Esto es, si det A # 0 existe A~\ 

3.9 Determinantes e independencia de vectores 

Del teorema 3.5 puede deducirse un sencillo criterio para averiguar la inde¬ 
pendencia de vectores. 

teorema 3.6. Un conjunto de n vectores At,..., A„ de un espacio n-di- 
mensional es linealmente independiente si y solo si d(Ai ,..., A„) # 0. 

Demostracion. Ya demostramos en el teorema 3.2 e) que la dependencia 
lineal implica d(A 1 ,..., A„) = 0. Para demostrar el recfproco, se supone que 
A,,,,A„ son linealmente independientes y se prueba que d(A t ,, A„) ¥= 0. 

Designemos con V n el espacio lineal de las n-plas de escalares. Puesto que 
A t ,. . ., A„ son n elementos independientes en un espacio n-dimensional, forma- 
ran una base para V n - Segun el teorema 2.12 existe una transformacion lineal 
T:V n V„ que aplica esos n vectores en los vectores coordenadas unidad, 

T{A k ) = 4 para k=l,2,...,n. 

Existe pues una matriz B, nXn, tal que 

A^B — 4 para & = 1,2 

Pero segun el lema 3.3 tenemos AkB = (AB)k, siendo A la matriz con las filas 
At ,..., A„. Luego AB — I, asi que A es no singular y det A 0. 

3.10 Detenninante de una matriz diagonal en bloques 

Una matriz cuadrada C de la forma 

r A O' 

O B 


C = 
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en la que A y B son matrices cuadradas y cada O representa una matriz de ceros, 
se denomina matriz diagonal en bloques con dos bloques A y B. Como ejemplo 
sea la matriz 5X5. 


C = 


'1 

0 

0 

0 

0 


0 

1 

0 

0 

0 


0 

0 

1 

4 

7 


0 0 ~ 
0 0 
2 3 
5 6 
8 9 


Los bloques diagonales son en este caso 







‘1 

2 

3 ' 


'1 

0 ” 






A = 

_0 

1 _ 

y 

B = 

4 

5 

6 






7 

8 

9 


El teorema que sigue demuestra que el determinante de una matriz diagonal 
en bloques es igual al producto de los determinantes de sus bloques diagonales. 


teorema 3.7. Para dos matrices cuadradas cualesquiera A y B se tiene 


(3.15) 



O' 

B 


= (det ^4)(det B ). 


Demostracion. .Supongamos que A es nXn y B es mXm. Observemos que 
la matriz diagonal en bloques dada, puede expresarse como un producto de la 
forma 


‘A 

O' 


'A 

O' 

'In 

O' 

0 

B 


0 


0 

B_ 


donde I„ e I m son matrices identidad de ordenes n y m respectivamente. Por con- 
siguiente, segun la formula del producto para determinantes tenemos 


1 

o 

1 _ 


© 

i_ 


r/„ oi 


= det 


det 


O B 


o i m _ 


O B_ 


(3.16) 


det 
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Consideremos ahora el determinante det 


'A O' 
P I m . 


como una funcion de n filas 


de A. Esto es posible debido al bloque de ceros del angulo superior derecho. 
Resulta facil comprobar que esta funcion satisface los cuatro axiomas de una 
funcion determinante de orden n. Por consiguiente, en virtud del teorema de 
unicidad, debe ser 


det 


'A O' 

P I m _ 


det A. 


Analogamente se demuestra que det 
(3.15). 


O' 

B 


= det B. Luego (3.16) implica 


3.11 Ejercicios 

1. Para cada una de las proposiciones siguientes relativas a matrices cuadradas, dar una 
demostracion o poner un contraejemplo. 

a) det {A + B) = det A + det B. 

b) det {(A + Bf} = {det (A + B)} 2 

c) det {(A + Bf} = det (A 2 + 2AB + B 2 ) 

d) det \(A + B f} = det (A 2 + B 2 ). 


2. a) Extender el teorema 3.7 a matrices con tres bloques diagonales: 


det 


A O O' 
O B O 
O O C 


(det /l) (det B)(det Q. 


b) Establecer y demostrar una generalizacion del teorema para matrices con un numero 
cualquiera de bloques diagonales. 



"1 

0 

0 

0" 


" a 

b 

c 

dr 


0 

1 

0 

0 


e 

f 

g 

h 

3. Sea A = 





, B = 




a 

b 

c 

d 


0 

0 

1 

0 


_e 

f 

g 

h_ 


_0 

0 

0 

1. 


a b 


. Demostrar que det A = det 


y que det B — det 


/. 


c d 

J h . 
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4. Establecer y demostrar una generalization del ejercicio 3 para matrices nxn. 


5. Sea A = 


'a b 0 O' 
c d 0 0 

e f S h 

x y z w 


. Demostrar que det A = det 


a b 
c d 


det 


> h ' 
z w 


6. Establecer y demostrar una generalization del ejercicio 5 para matrices nxn de la forma 


A = 


5 O 

c z> 


donde B, C, D son matrices cuadradas y O es una matriz de ceros. 

7. Aplicar el teorema 3.6 para determinar si los siguientes conjuntos de vectores son lineal- 
mente dependientes o independientes. 


a) A 1 = (1, -1,0), A 2 = (0, 1, -1), A 3 = (2, 3, -1). 

b) A x = (1, -1,2, 1),^ 2 = (-1,2, -1,0), X 3 = O, -1, 1,0), = (1,0,0,1). 

c) A x = (1,0, 0,0, 1),4-(1, 1,0,0,0),4 = (1,0, 1,0,1), A x = (1,1,0, 1,1), 
A, = (0,1,0, 1,0). 


3.12 Fdrmulas para desarrollar determinantes. Menores y cofactores 

No hemos demostrado todavfa la existencia de una funcion determinante, 
excepto en el caso 2x2. En esta seccion utilizamos la linealidad y el teorema de 
unicidad para demostrar que, si existen determinantes, pueden calcularse mediante 
una fdrmula que expresa cualquier determinante de orden n como una combi- 
nacion lineal de determinantes de orden n— 1. La igualdad (3.2) de la seccion 3.1 
es un ejemplo de esa formula en el caso 3X3. La formula general sugerira un 
metodo para demostrar por induccion la existencia de funciones determinantes. 

Toda fila de una matriz A.nXn, puede expresarse como una combinacion 
lineal de los n vectores coordenados unidad I x ,... ,I n . Por ejemplo, la primera 
fila A x puede escribirse como sigue: 

A\ — 2 a i ■ 

Puesto que los determinantes son lineales respecto a la primera fila tenemos 
(3-17) d(A x , A 2 ,, A n ) — d(^aijIj,A 2 , ■ . . , = 2 a u j , A 2 ,. . . , A n ). 

V=1 / 3=1 
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Por consiguiente para calcular det A basta calcular d(/,-, A 2 ,..., A„) para cada 
vector coordenado unidad /,-. 

Utilicemos la notation A',,- para representar la matriz obtenida de A reempla- 
zando la primera fila A 1 por el vector unitario /,-. Por ejemplo, si n = 3 existen 
tres matrices de ese tipo: 



‘ l 

0 

0 ' 


' 0 

1 

0 " 


'o 

0 

1 ' 

4 = 

a 21 

a 22 

a 23 

> aj 2 — 

°21 

°22 

a 23 

II 

■v 

T 

a 21 

a 22 

a 23 


-°31 

a 32 

a 33 - 


- a 31 

a 32 

a 33 - 


- a 31 

°32 

a 33 - 


Observemos que det A'y — d(Ij, A 2 ,..., A„). La igualdad (3.17) puede ahora 
escribirse en la forma 


(3.18) det A = 2 a u det A' Xj . 

j =i 

Esta es una formula de desarrollo; y en ella se expresa el determinante de A 
como una combination lineal de los elementos de su primera fila. 

El razonamiento utilizado para deducir (3.18) puede aplicarse a la fila k en 
lugar de hacerlo con la primera. El resultado es una formula de desarrollo en 
funcion de los elementos de la fila k. 

teorema 3.8. desarrollo por cofactores. Sea A' ki la matriz obtenida 
de la matriz A al sustituir la fila k de Ak por el vector coordenado unidad J,. 
Se obtiene entonces la fdrmula de desarrollo 

(3.19) det A = det Kj 

3=1 

que expresa el determinante de A como combinacidn lineal de los elementos de 
la fila k. El numero det A' kj se llama cofactor o adjunto del elemento ay. 

En el teorema que sigue demostraremos que cada cofactor es, salvo el signo, 
igual al determinante de una matriz de orden n— 1 . Esas matrices se Hainan 
menores. 

definici6n. Dada una matriz cuadrada A de orden n ^ 2, la matriz cua- 
drada de orden n— 1 obtenida suprimiendola fila k y la columna j de A se llama 
menor k,j de A y se designa por Ay . 


ejemplo. Una matriz A = ( ay ) de orden 3 tiene nueve menores. Tres de 
ellas son 


a 22 

a 23 

II 

(N 

a 21 

a 23 

_ a 32 

a 33_ 


. a 31 

C 33_ 



r a 2i 

a 22 

A 13 — 

i 

fl 32. 
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La igualdad (3.2) expresa el deteminante de una matriz 3X3 como una 
combinacidn lineal de los determinantes de esas tres menores. La formula puede 
escribirse como sigue: 

det A — flji det A k j fli 2 det > 4 j 2 -)■ a ±3 det A 13 . 

El siguiente teorema extiende esa formula al caso nXn para cualquier n ^ 2. 


TEOREMA 3.9. DESARROLLO POR LAS MENORES CORRESPONDIENTES A LA FILA 
k. Para cualquier matriz A, nXn, n s 2,el cofactor de ay esta relacionado con 
la menor Ay por la formula 

(3.20) det A' kj = (-1 f +i det A kj . 


Por consiguiente, el desarrollo del det A en funcidn de los elementos de la fila k 
viene dado por la fdrmula 


(3.21) det A = 2 (- l) k+i a kj det A kj . 


Demostracion. Consideremos primero el caso particular k = j — 1 . La ma¬ 
triz A' u tiene la forma 


1 0 0 ••• 0 
a 2 1 a 22 a 23 • • • a in 


A'u = 


a 31 


a 32 a 33 ' ' ' a 3 n 


I—^nl ^n2 * ^nn—i 


Aplicando las operaciones elementales del tipo (3) a las filas, podemos convertir 
en ceros todos los elementos situados debajo del 1 en la primera columna, dejando 
invariables los demas elementos. Por ejemplo, si multipllcamos la primera fila de 
A'u por — a 2 i y sumamos el resultado a la segunda fila, la nueva segunda fila sera 
(0 , a 22 ,a 23 ...., flan). Por medio de una sucesion de esas operaciones elementales 
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con las filas obtenemos una nueva matriz que designaremos con y que tiene 
la forma 


1 0 ••• 0 

0 a 22 ‘ ' ‘ 

0 a 32 • > • a 3n 


L0 a n2 ■■■ a nn J 


Puesto que las operaciones con las filas del tipo (3) no modifican el determinante 
tenemos 


(3.22) det Ah = det A ' u . 

Pero A es un matriz diagonal en bloques, asi que, en virtud del teorema 3.7, 
tenemos 


det Ah = det A 1X , 


siendo An la menor 1,1 de A, 


a a 


a 32 


An — 


“in 

a 3n 


\_ a n2 ’ * * a nn _J 


Por consiguiente det A' n = det A„, lo que demuestra (3.20) para k = j = 1. 

Consideremos seguidamente el caso particular k = l, j cualquiera, y demos- 
tremos que 


(3.23) det A[ } = (—1) ,_1 det A u . 

Una vez demostrada (3.23) la fdrmula (3.20) mas general resulta inmediatamente, 
debido a que la matriz A' kj puede transformarse en una matriz de la forma B’ u 
mediante k— 1 intercambios sucesivos de filas adyacentes. El- determinante cam- 
bia de signo en cada transposicidn, asf que 


det A' kj = (-1)*" 1 det B' u , 


(3.24) 
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siendo B una matriz tiXn cuya primera fila es J, y cuya menor 1,/, Bjy.es Ay. 
Segun (3.23), tenemos 

del B[, = {-ly- 1 det Bjy = (-1) 3 '- 1 det A ki , 

con lo que (3.24) nos da 

det A' ki = (-l)^-!) 3 '- 1 det A kj = (-1)*+* det A kj . 

Por lo tanto si demostramos (3.23) tambien demostramos (3.20). 

Vamos ahora a demostrar (3.23). La matriz A' u tiene la forma 

1 • • • 0 
a%j * ®2n 


a n j u nn 

Mediante operaciones elementales con las filas del tipo (3) introduzcamos una 
columna de ceros debajo del 1 y la transformamos en 

■ 0 • • • 0 1 0 

°21 ' ’ ' a 2,j~l 0 a 2,j+l 

A 0 — 

i ~ 

- a nl ' ‘ ' a n,i -1 0 a„j + i 

Como antes, el determinante no varia, asi que det A 0 U = det A ' u . La matriz menor 
Aif tiene la forma 

a 21 ' ‘ ’ a 2,i-l °2.i+l 

A Xj = ’ 

_ a nl ‘ ‘ • a n,i-l a n.i +1 

Consideremos seguidamente el det A^ como una funcion de las n— 1 filas de A xi , 
pongamos det A\ i — /(Ai,). La funcion / satisface los tres primeros axiomas de 
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una funcion determinants de orden n — 1 . Por consiguiente, segun el teorema de 
unicidad podemos escribir 

(3.25) f(A lj )=f(J)detA lj , 


en donde / es la matriz identidad de orden n — 1 . En consecuencia, para demos- 
trar (3.23) debemos demostrar que /(/) = (•—1) ,_1 . Por definicion /(/) esel deter¬ 
minants de la matriz 


C = 


~0 ••• 0 1 0 ••• O' 
1 0 0 0 0 



0 ••• 1 0 0 ••• 0 

0 ••• 0 0 1 ••• 0 



p ••• 00 0 ••• 1 

t 

Columna j 


Fila j 


Los elementos situados en las lineas oblicuas son todos iguales a 1. Los res¬ 
tates elementos no escritos son todos 0. Intercambiando la primera fila de C 
sucesivamente con las filas 2, 3,...,/ llegamos a la matriz identidad I de orden 
nXn despues de /—I transposiciones. El determinante cambia de signo en cada 
transposicion, asi que detC = (— 1 V -1 . Luego /(/) = ( — lp -1 ', lo que demues- 
tra (3.23) y por tanto (3.20). 


3.13 Existencia de la funcion determinante 


En esta section utilizamos la induction respecto de n, que es el orden de la 
matriz, para demostrar la existencia de las funciones determinantes de cualquiei 
orden. Para n= 2 ya hemos demostrado que existe una funcion determinante. Para 
el caso n= 1 aceptamos por definicion que det [flu] = flu . 

Suponiendo que existe una funcion determinante de orden «— 1, parece 16- 
gico que una funcion determinante de orden ti fuera una de las formulas de 
desarrollo del teorema 3.9, por ejemplo, el desarrollo mediante las menores de la 
primera fila. No obstante, resulta mas sencillo comprobar los axiomas si utilizamos 
una formula analoga expresada en funcion de las menores de la primera columna. 



Existencia de la funcidn determinante 


111 


teorema 3.10. Supongamos la existencia de determinantes de orden n— 1. 
Para urn matrix nXn cualquiera A = (a jk ), sea f la funcidn definida por la 


(3.26) f(A lt ...,A n )= £(-l Y +1 a n det A n . 

Entonces f satisface los cuatro axiomas de urn funcidn determinante de orden n. 
Por consiguiente, por induccion, los determinantes de orden n existen para todo n. 

Demostracidn. Consideremos cada termino de la suma (3.26) como una 
funcion de las filas de A y escribamos 

fj{.A \»• • • > A„) = (—iy +1 a n det A n . 

Si comprobamos que cada /, satisface los axiomas 1 y 2 tambien / los satisfara. 

Multipliquemos la primera fila de A por un escalar t. Tal multiplicacion no 
afecta a la menor An puesto que esta no incluye la primera fila. El coeficiente 
a a esta multiplicado por t, asi que tenemos 


f\(tA \, A 2 ,.. . , A n ) — tan det A 1 j — tf 1 (A 1 ,... , A n ). 

Si / > 1 la primera fila de cada menor An queda multiplicada por t y el coeficiente 
a ;i no queda afectado, por lo que otra vez tenemos 

fj(jA i , A 2 ,..., A n ) = tf j (A 1 , A 2 ,..., A„). 

Por lo tanto, cada /,• es homogenea en la primera fila. 

Si se multiplica por t la fila k de A, siendo k > 1, la menor Ak, no se modi- 
fica pero a*i queda multiplicado por t, por lo que fk es homogenea en la fila k. 
Si / # k, el coeficiente a ;1 no se afecta pero alguna fila de A^ queda multiplicada 
por t. Luego toda /, es homogenea en la fila k. 

Un razonamiento parecido demuestra que cada // es aditiva respecto a cual- 
quier fila, por lo cual / satisface los axiomas 1 y 2. Seguidamente demostramos 
que / satisface el axioma V, la version particular del axioma 3. Del teorema 3.1, 
se deduce entonces que / satisface el axioma 3. 

Para comprobar que / satisface el axioma 3', supongamos que sean iguales 
dos filas consecutivas de A, sean Ak = Ak+i . Entonces, excepto las menores Aki 
y Ak+xn , cada menor A n tiene dos filas iguales de modo que det A,i = 0 . Por lo 
tanto la suma (3.26) consta tan solo de los dos terminos correspondientes a 
/ = k y j = k + 1 , 

(3.27) f(A lt . ..,A n ) = (-1 ?+ia kl det A kl + (-1 ) k+t a k+ ^ det A k+11 . 
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PerO'-A*! = A k+1A y an = a*+i.i ya que A k = A*+t . Por consiguiente, los dos 
terminos de (3.27) difieren tan solo en el signo, por lo que f(A lt ...,A n )= 0. 
Asi pues, / satisface el axioma 3'. 

Por ultimo, comprobamos que / satisface el axioma 4. Cuando A — I tene- 
mos an = 1 y c/! = 0 para /' > 1 . Asimismo, A lx es la matriz identidad de 
orden n— 1 , por lo cual cada termino de (3.26) es cero salvo el primero, que 
es igual a 1 . Luego f(h ..... i«) = 1 por lo que / satisface el axioma 4. 


En la demostracion anterior podria haberse muy bien utilizado una funcion / 
definida en funcion de las menores A jk de la columna k en lugar de las menores 
An de la primera columna. En efecto, si ponemos 

(3.28) f{A \,.... A n ) = 2( iy^ ka nc det A jk , 

3=1 


exactamente el mismo dpo de demostracion hace ver que esa / satisface los cua-- 
tro axiomas de una funcion determinante. Puesto que las funciones determinantes 
son unicas, las formulas de desarrollo (3.28) y las de (3.21) son todas iguaks 
a detA. 

Las formulas (3.28) no solo establecen la existencia de las funciones deter¬ 
minantes sino que tambien ponen de manifiesto un nuevo aspecto de la teoria de 
los determinantes — una conexion entre las propiedades relativas a filas y las 
propiedades relativas a columnas. Tal conexion se expone en la seccion siguiente. 

3.14 Determinante de una matriz transpuesta 

Asociada a cada matriz A se considera otra matriz llamada transpuesta de A 
y designada por A\ Las filas de A* son las columnas de A. Por ejemplo, si 


A = 


'1 2 
4 5 



entonces A* = 


'1 

2 

3 


4' 

5 

6 


Una definicion formal puede darse asf: 

definici6n de transpuesta. La transpuesta de una matriz, mXn, 
A = («j J )”V”i es la matriz, nXm, A‘ cuyo elemento i,j es a,,-. 

Si bien la transposicion puede aplicarse a cualquier matriz rectangular nos 
referiremos en primer lugar a las matrices cuadradas. A continuacion demostramos 
que la transposicion de una matriz cuadrada no modifies su determinante. 
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teorema 3.11. Para toda matriz A, nXn, tenemos 

det A = d etA 1 . 

Demostracion. Se demuestra por induction en n. Para n — 1 y n = 2 el 
resultado se comprueba inmediatamente. Supongamos, entonces, que el teorema es 
cierto para matrices de orden n—l. Sean A = (a,,) yB lt = A‘ = (b„). Desarro- 
llando det A por sus menores correspondientes a la primera columna y det B por 
sus menores relativos a la primera fila tenemos 


det A = 2(—l) i+1 a n det A n , det B =^,(—l) i+1 b lj det B Xj . 

3=1 3=1 

Pero por la definition de transpuesta tenemos b lt - = a^ y B Xj = (A,,)*. Puesto que 
hemos supuesto que el teorema es cierto para matrices de orden n—l tenemos 
det Bij = det A ;1 . Luego las sumas anteriores coinciden termino a termino, con 
lo que det A = det B . 

3.15 La matriz cofactor 

El teorema 3.5 puso de manifiesto que si A es no singular,det A 0. El teore¬ 
ma siguiente demuestra el reciproco. Esto es, si det A ¥= 0, existe A -1 . Ademas, 
da una formula para expresar A -1 en funcion de una matriz formada con los 
cofactores de los elementos de A. 

En el teorema 3.9 se demostro que el cofactor de ay es igual a ( — l) 4+i det An, 
siendo A*,- la menor i,j de A. Designemos ese cofactor por cof an . Asi pues, por 
definicion, 


cof a tj = (—l) w det A {j . 

definicion de matriz cofactor. La matriz cuyo elemento i,j es cof ay se 
llama la matriz cof actor de A (*) y se designa por cof A. Asi pues, tenemos 


cof A = (cof a,j)” j=1 = ((—l) t+J det A ij )” j=1 . 

El teorema que sigue demuestra que el producto de A por la transpuesta de 
su matriz cofactor es, salvo un factor escalar, la matriz identidad /. 


(*) En la literatura sobre matrices, especialmente en los tratados clfisicos, la transpuesta 
de la matriz cofactor se llama adjunta de A. No obstante, la nomenclatura actual reserva la 
palabra adjunta para otra cosa completamente distinta, que se discutira en la seccidn 5.8. 
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teorema 3.12. Para cualquier matriz A, nXn, con n — 2 tenemos 

(3.29) A (cof A)* = (det A)/. 

En particular, si det A # 0 existe la inversa de A y viene dada por 


A - 1 


1 

det A 


(cof A)*. 


Demostracion. Utilizando el teorema 3.9 expresamos det A en funcion de 
sus cofactores relativos a la fila k por la formula 

N 

n 

(3.30) det A = 2 a kj cof a kj . 

3=1 

Mantengamos fija k y apliquemos esta relacion a una nueva matriz B cuya fila i 
es igual a la fila k de A para alguna i & k, y cuyas filas restantes son las mismas 
que las de A . Entonces det B = 0 debido a que las filas i y k de B son iguales. 
Expresando det B en funcion de sus cofactores relativos a la fila i tenemos 

(3.31) det 5=2 b u cof b tj = 0. 

3=1 


Pero ya que la fila i de B es igual a la fila k de A tenemos 

bij = a k j y cof b H — cof a {j . para cualquier j. 
Luego (3.31) establece que 

n 

(3.32) ^ a kj cof a u = 0 si k^i. 

3=1 


Las igualdades (3.30) y (3.32) pueden escribirse conjuntamente asi: 


(3.33) 



3=1 


(det A 
(0 


si i = k 
si i ?£ k. 


Pero la suma que aparece en el primer miembro de (3.33) es el elemento k,i 
del producto A(cof Af. Por consiguiente (3.33) implica (3.29). 


Como corolario directo de los teoremas 3.5 y 3.12 tenemos la siguiente con- 
dicion necesarxa y suficiente para que una matriz cuadrada sea no singular. 
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teorema 3.13. Una matriz cuadrada A es no singular si y solo si det A¥= 0 . 

5.16 Regia de Cramer 

El teorema 3.12 puede tambien utilizarse para resolver un sistema de ecua- 
ciones lineales con matriz no singular. Las formulas que se obtienen constituyen 
la llamada regia de Cramer, en memoria del matematico suizo Gabriel Cramer 
(1704-1752). 

teorema 3.14. regla de cramer. Si un sistema de n ecuaciones lineales 
con n incognitas x x ,..., x„ , 


(3.34) ~ b i 0 = 1, 2,... , n) 

i =1 

tiene la matriz de los coeficientes A — (an) no singular, existe una solucion unica 
para el sistema dada por las formulas 

1 ^ c 

2X cof ’ para j ==i ’ 2 .«• 

fc=i 

Demostracion. El sistema se puede poner en forma matricial 


AX — B, 



■*r 


'b{ 

en donde X y B son matrices columna, X = 

• 

, B = 

• 


X«. 


bn. 


. Puesto que A 


es no singular existe una solucion unica X dada por 

(3.35) X = A~ X B = —(cof A)*B. 

det A 

Las formulas (3.34) se obtienen igualando los componentes en (3.35). 

Debe observarse que la formula para Xj en (3.34) se puede expresar como 
cociente de dos determinantes, 


x i = 


det Cj 
det A 
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en donde C, es la matriz obtenida de A al reemplazar la columna j de A por la 
matriz columna B. 


3.17 Ejercicios 

1. Determinar la matriz cofactor de cada una de las matrices siguientes: 







' 3 

1 

2 

4' 



2 

-1 

3 







1 

2 






2 

0 

5 

1 

a) 



, b) 

0 

1 

1 

, c) 






3 

4 






1 

-1 

-2 

6 





-1 

-2 

0 







! 





-2 

3 

2 

3. 


2. Determinar la inversa de cada una de las matrices no singulares del ejercicio 1. 

3. Hallar todos los valores del escalar X para los que la matriz \I — A es singular, si A 
es igual a 



'0 

3" 


'l 

0 

2 


" 11 

-2 

8 " 

a) 

2 

-1 

b) 

0 

-1 

-2 

. c) 

19 

-3 

14 




2 

-2 

0 


.~ 8 

2 

—5_ 


4. Si A es una matriz nXrt con n > 2, demostrar cada una de las propiedades de su ma¬ 
triz cofactor: 

a) cof (A*) = (cof a)* . b) (cof AY A = (det A)I. 

c) A(cof A)‘ = (cof A)'A (A es permutable con la transpuesta de su matriz cofactor). 

5. Resolver mediante la regia de Cramer cada uno de los sistemas que siguen: 

a) x + 2y + 3z = 8, 2x — y + 4z = 7, — y + z — 1. 

b) x + y + 2z =*0, 3x — y — z — 3, 2x + 5y + 3z = 4. 

6. a) Justificar que cada una de las ecuaciones que siguen es la ecuaci6n cartesiana de 
una recta, en el piano xy, que pasa por los puntos (x u y ,) y (x 2 , y 2 ). 


det 


x — Xi 
*2 ~ *1 


y -yi 
y* -yi. 


= 0 ; 


det 


■ y i 

i yi i 

|_*2 y t i . 


= o. 


b) Establecer y demostrar relaciones analogas, en el espacio de tres dimensiones, para 
un piano que pasa por tres puntos. 

c) Establecer y demostrar relaciones anilogas en el piano xy para una circunferencia 
que pasa por tres puntos no alineados. 
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7. Dadas n 1 funciones f„ cada una derivable en un intervalo (a, b), definir F(x) = 
= det [/<j(x>] para cada x en (a, 3). Demostrar que la derivada F'(x) es una suma de 
n determinantes. 


F'(x) = 2 det Ai(x ), 


i=l 


donde Ai{x) es la matrix que se obtiene derivando las funciones de la fila i de [/i,(x)]. 

8. Una matriz nxn de funciones de la forma W(x) = [«yC* _1 )(x)], en la que cada fila 
despu6s de la primera es la derivada de la fila anterior, se llama matriz wronskiatia en 
recuerdo del matematico polaco J. M. H. Wronski (1778-1853). Demostrar que la derivada 
del determinante de W(x) es el determinante de la matriz obtenida derivando cada uno 
de los elementos de la ultima fila de W(x). 

[ Indicacidn: Utilizar el ejercicio 7.] 
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AUTOVALORES Y AUTOVECTORES 


4.1 Transformaciones lineales representadas mediante matrices diagonales 

Sea T: V V una transformation lineal en un espacio lineal V de dimension 
finita. Las propiedades de T que son independientes de cualquier sistema de coor- 
denadas (base), se denominan propiedades intrinsecas de T. Si se puede elegir una 
base de manera que la matriz resultante tenga una forma especialmente sencilla, 
existe la posibilidad de reconocer algunas de las propiedades directamente a partir 
de la representacion matricial. 

Entre los tipos sencillos de matrices estan las diagonales. Cabe entonces pre- 
guntarse si toda transformacion lineal puede representarse mediante una matriz 
diagonal. En el capitulo 2 se trato el problema de hallar una representacion en 
matriz diagonal de una transformacion lineal T: V W, siendo dim V = n y 
dim W = m. En el teorema 2.14 se demostro que siempre existe una base 
(gj, ,..., e n ) para V y otra (iv,,..., w m ) para W tales que la matriz de T en re¬ 
lation a este par de bases es una matriz diagonal. En particular, si W = V la 
matriz sera cuadrada. Ahora se trata de utilizar la misma base para V y W. Con 
esta restriction no siempre es posible encontrar una representacion de T en matriz 
diagonal. Abordemos, entonces, el problema de determinar que transformaciones 
tienen una representacion en matriz diagonal. 


Notacidn: Si A - (a„) es una matriz diagonal escribimos A — diag (an, an,..., aj. 


Es sencillo establecer una condition necesaria y suficiente para que una trans¬ 
formacion lineal tenga una representacion en matriz diagonal. 

teorema 4.1. Dada una transformation T:V~*V, donde dim V = n. 
Si T tiene una representation en matriz diagonal, existe entonces un conjunto de 
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elementos independientes u x ,... ,u n de V y un correspondiente conjunto de esca- 
lares k x ,... ,K tales que 

(4.1) T(u k ) — X k u k para k = 1, 2,... , n. 

Reciprocamente, si existe un conjunto independiente u, ,..., u„ en V y un con- 
junto correspondiente de escalares k x ,...,K que satisfacen (4.1), entonces la 
matriz 


A = diag (X lt ... , X n ) 

es una representacion de T resipecto a la base (u x ,... ,u„) . 

Demostracion. Supongamos primero que T tiene una representacion en ma¬ 
triz diagonal A = (a ik ) con respecto a la base (e x .... ,e n ). La accion de T sobre 
los elementos de la base viene dada por la formula 

n 

T ( e k) = 2 a ik e i = a kk e k 

<=i 

puesto que an = 0 para i¥= k . Esto demuestra (4.1) con = e* y \ k = akk. 

Supongamos ahora que existen los elementos independientes u x ,... ,u„ y 
los escalares K , • • ■ ,K que satisfacen (4.1). Puesto que u Xt . ..,Un son indepen¬ 
dientes, constituyen una base para V. Si definimos akk — >-k y an = 0 para i ¥= k, 
entonces la matriz A = (an) es una matriz diagonal que representa T con res¬ 
pecto a la base (u x ,...,«„). 

Asi pues.el problema de hallar una representacion en matriz diagonal de una 
transformacion lineal se ha reducido a otro, el de hallar los elementos indepen¬ 
dientes «!,..., u n y los escalares K , ■ ■ • ,K que satisfagan (4.1). Tales elemen¬ 
tos Uk y escalares A* se llaman autovectores o vectores propios y autovalores de T, 
respectivamente. En la section siguiente estudiamos los autovectores y autovalo¬ 
res (*) en un aspecto mas general. 

4.2 Autovectores y autovalores de una transformacidn lineal 

En esta discusion.V representa un espacio lineal y S un subespacio de V. Los 
espacios S y V no han de ser necesariamente de dimension finita. 


(*) Las palabras autovector y autovalor son las traducciones de las palabras alemanas 
Eigenvektor y Eigenwert. Algunos autores emplean los tdrminos vector caracteristico, o vector 
propio como sinonimos de autovector. Los autovalores tambidn se llaman valores caracteris- 
ticos o propios. 
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definici6n. Sea T: S -> V una transformation de S en V . Un escalar X se 
denomina autovalor de T si existe un elemento no nulo x en S tal que 

14.2) T{x) = . 

El elemento x se llama autovector de T pertenetiente a X. El escalar X se llama 
autovalor correspondiente a x . 

Existe un solo autovalor correspondiente a un autovector dado x . En efecto, 
si tenemos T(x) = \x y T(x) = fix para un cierto x¥^ O , entonces Xx = nx con 
lo que X = n. 


Observation: Si bien la ecuacidn (4.2) siempre es vdlida para x = O y cual- 
quier escalar X, la aefinicidn excluye O como autovector. Esto se justifica por tener 
que existir un solo autovalor X asociado a un autovector dado x. 

Los ejemplos siguientes ponen de manifiesto el significado de esos conceptos. 

ejemplo 1. Multiplication por un escalar fijado. Sea T: S -* V la trans¬ 
formation lineal definida por la ecuacion T(x) = cx para cada x de S, siendo c 
un escalar fijado. En este ejemplo todo elemento no nulo de S es un autovector 
perteneciente al escalar c. 

ejemplo 2. El autoespacio E(X) que consta de todos los x tales que 
T(x) = \x. Sea T: S -> V una transformacion lineal que tiene un auto valor X. 
Sea £(X) el conjunto de todos los elementos x de S tales que T(x) = X* . Este con- 
junto contiene el elemento O y todos los autovectores pertenecientes a X. Es fdcil 
demostrar que E(X) es un subespacio de S, porque si x e y estan en £(X) tenemos 

T(ax + by) — aT{x) + bT(y) = alx + bly = k(ax + by) 

para todos los escalares a y b. Luego (ax + by) e E(X) asi que £(X) es un sub¬ 
espacio. El espacio £(X) se llama autoespacio correspondiente a X. Puede ser de 
dimensidn finita o infinita. Si E(X) es de dimensidn finita entonces dim £(X) ^ 1, 
ya que E(X) contiene por lo menos un elemento x no nulo correspondiente a X. 

ejemplo 3. Existencia de autovalores cero. Si existe un autovector no 
puede ser cero, por definicidn. Sin embargo, el escalar cero puede ser un auto¬ 
valor. En efecto, si 0 es un autovalor para x entonces T(x) — Ox = O, por lo que 
x es del nucleo de T. Reciprocamente, si el nucleo de T contiene elementos no 
nulos cada uno de dsos es un autovector con autovalor 0. En general, £(X) es 
el nucleo de T — X/. 

ejemplo 4. Reflexidn en el piano xy. Sea S — V — V 3 (R) y sea T una 
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reflexion en el piano xy. Esto es, T actua sobre los vectores bases i, j, k de la si- 
guiente manera: T(/) = /, T(j) = j, T(k) — —k. Cada vector no nulo en el 
piano xy es un autovector con un autovalor 1. Los autovectores restantes son de 
la forma ck, donde c¥= 0 ; cada uno de ellos tiene el autovalor — 1 . 

ejemplo 5. Rotation del piano. Este ejemplo es particularmente intere- 
sante porque pone de manifiesto que la existencia de autovectores puede depender 
del cuerpo fundamental de escalares. El piano puede considerarse como un espacic 
lineal de dos maneras distintas: 1 ) como un espacio lineal real de dimension 2 , 
V — V 2 (R), con dos elementos base (1,0) y (0, 1), y con numeros reales como 
escalares; o 2) como un espacio lineal complejo de dimension 1 , V = VAC), con 
un elemento base 1 , y los numeros complejos como escalares. 

Consideremos primero la segunda interpretacion. Cada elemento z ¥= 0 de 
V,(C) se puede expresar en forma polar, z = re w . Si T imprime a z un giro de 
angulo a entonces T(z) — re i{6+a) = e ia z. Asi pues, cada z ^ 0 es un autovector 
con autovalor A = e ia . Observese que el autovalor e ia no es real a menos que x 
sea un multiplo entero de 7 r. 

Consideremos ahora el piano como un espacio lineal real, V 2 (R). Puesto que 
los escalares de V 2 (R) son numeros reales, la rotacion T admite autovalores reales, 
unicamente si a es un multiplo entero de v . Dicho de otro modo, si a no es mul¬ 
tiplo entero de n entonces T no tiene autovalores reales y por tanto tampocc 
autovectores. De esto resulta claro que la existencia de autovectores puede de¬ 
pender de la eleccion de los escalares para V. 

ejemplo 6. El operador derivada. Sea V el espacio lineal de todas las fun- 
ciones reales / que admiten derivadas de cualquier orden en un intervalo abierto 
dado. Sea D la transformacion lineal que aplica cada / en su derivada, D(f) = f . 
Los autovectores de D son aquellas funciones / no nulas que satisfacen una ecua- 
cion de la forma 


f' = ¥ 


para un cierto numero real A.. Esta es una ecuacion diferencial lineal de primer 
orden. Todas sus soluciones vienen dadas por la formula 


f(x) = ce Xx , 


donde c es una constante real arbitraria. Por consiguiente, los autovectores de D 
son todas las funciones exponenciales f(x) = ce Xx con c ¥= 0 . El autovalor corres- 
pondiente a f(x) = ce Kx es A . En ejemplos como 6ste,en los que V es un espacio 
funcional los autovectores se llaman autofunciones. 
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ejemplo 7. El operador integracidn. Sea V el espacio lineal de todas las 
funciones continuas en un intervalo finito [a, 6]. Si / e V,designemos por g—Tif) 
a la funcion dada por 


g(x ) = / fit) dt si a <,x £b. 

•'O 

Las autofunciones de T (si existen) son aquellas / no nulas que satisfacen una 
ecuacion de la forma 

(4.3) J*/(0 dt = Xf{x) 

para algun valor real A. Si existe una autofuncion podemos derivar esta 
ecuacion para obtener la relation fix) = Lf(x), de la cual encontramos 
fix) = ce x/x , con tal que A ^ 0. Dicho de otro modo, las dnicas autofunciones 
posibles son aquellas funciones exponenciales de la forma fix) = ce x/x con c # C 
y A ^ 0. No obstante, si ponemos x = a en (4.3) obtenemos 


0 = A/(a) = kce a, \ 


Puesto que e a/x nunca es cero, vemos que la ecuacion T(/) = A/ no puede satis 
facerse con una / no nula, asi que T no tiene autofunciones ni autovalores. 

ejemplo 8. Subespacio engendrado por un autovector. Sea T: S -> V una 
transformacion lineal que tiene un autovalor A. Sea x un autovector perteneciente 
a A y sea Lix) el subespacio engendrado por x. Esto es, L[x) es el conjunto de 
todos los productos de x por escalares. Es facil demostrar que T aplica Lix) en si 
mismo. En efecto, si y = cx tenemos 

Tiy) = Ticx ) = cTix) = c(Ax) = A(cx) = ).y. 

Si c 0 entonces y^O por lo que todo elemento no nulo y de L(x) es tambien 
un autovector perteneciente a A. 

Se dice que un subespacio U de S es invariante en la transformacidn T, si 
esta aplica cada elemento de U en otro elemento de U. Acabamos de demostrar 
que el subespacio engendrado por un autovector es invariante en T. 

4.3 Independencia lineal de autovectores correspondientes a autovalores distintos 

Una de las propiedades mas importantes de los autovalores es la que se 
expone en el teorema siguiente. Como antes, S representa un subespacio de un 
espacio lineal V. 
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teorema 4.2. Si ui,... ,Uk son autovectores de una transformation lineal 
T:S -» V, y los autovalores Ai,..., A* son distintos, entonces los autovectores 
Ui,, Uk son independientes 

Demostracion. La demostracion es por induccion en k. El resultado es 
trivial cuando k = 1. Supongamos, entonces, que ha sido demostrado para cual- 
quier conjunto de A: — 1 autovectores. Sean u t ,... ,u k ,k autovectores pertenecien- 
tes a autovalores distintos, y supongamos que existen escalares c, tales que 

k 

(4.4); 2 c { Ui = O. 

1=1 

Aplicando T a los dos miembros de (4.4) y utilizando el hecho de que 
T(ud = A iUi encontraiqos 


(4.5) lc,M = 0. 

t=l 

Multiplicando (4.4) por A . k y restando de (4.5) obtenemos la ecuacion 


k-l 


2 c i(K - 4K = o. 

t=i 


Pero ya que Ut,... ,u k - 1 son independientes,debe ser c,( h — X k ) = 0 para cada 
i = 1, 2, ... , k — 1. Puesto que los autovalores son distintos tenemos A, ^ A* 
para i ¥= k asi que c, = 0 para i = 1, 2, ..., k — 1. En virtud de (4.4) vemos 
que c* es tambien 0, por lo que los autovectores u k ,..., u k son independientes 

Observese que el teorema 4.2 no serf a cierto si el elemento cero pudiera ser 
un autovector. Esta es otra razon para excluir O como autovector. 

Advertencia: El reci'proco del teorema 4.2 no es cierto. Esto es, si T tiene 
autovectores independientes u t ,... ,u k , entonces los correspondientes autovalores 
Ai ..... At no son necesariamente distintos. Por ejemplo, si T es la transformation 
identica, T(x) = x para todo x, entonces todo x ^ O es un autovector, pero existe 
s61o un autovalor, \ = 1. 

El teorema 4.2 tiene consecuencias importantes en el caso de dimension 
finita 

teorema 4.3. Si dim V — n, toda transformacidn lineal T : V -> V tiene 
por lo mends n autovalores distintos. Si T tiene exactamente n autovalores distin¬ 
tos, entonces los autovectores correspondientes forman una base para V y la 
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matriz de T relativa a esa base es una matriz diagonal con los autovalores como 
elementos diagonales. 

Demostracidn. Si existieran n + 1 autovalores distintos, entonces, segun el 
teorema 4.2, V contendrfa n + 1 elementos independientes. Esto no es posible 
puesto que dim V = n. La segunda afirmacion se deduce de los teoremas 4.1 y 
4.2. 


Observacidn: El teorema 4.3 nos dice que la existencia de n autovalores distintos 
es una condition suficiente para que T tenga una representacidn en matriz diagonal. 
Esta condicidn no es necesaria. Existen transformaciones lineales con menos de n auto¬ 
valores distintos que pueden representarse mediante matrices diagonales. La transfor¬ 
mation identidad es un ejemplo. Todos sus autovalores son iguales a 1 pero puede re¬ 
presentarse por la matriz identidad. El teorema 4.1 nos dice que la existencia de n 
autovalores independientes es necesaria y suficiente para que T admita una representa- 
cidn en matriz diagonal. 


4.4 Ejercicios 

1. a) Si T tiene un autovalor X, demostrar que aT tiene el autovalor a\. 

b) Si x es un autovector para T t y T 2 demostrar que tambien lo es para aTi -f bTi. 
iComo estln relacionados los autovalores? 

2. Supongamos que T\V-*V tiene un autovector x perteneciente a un autovalor X. De¬ 
mostrar que x es un autovector de T 2 perteneciente a X 2 y, con mayor generalidad, x es 
un autovector de T" perteneciente a X". Utilizar luego el resultado del ejercicio 1 para 
demostrar que si P es un polinomio, entonces x es un autovector de P(T) perteneciente 
a P(X). 

3. Consideremos el piano como un espacio lineal real, V = V 2 (R), y sea T un giro de V 
de ir/2 radianes. Si bien T no tiene autovectores, demostrar que todo vector no nulo 
es un autovector de T 2 . 

4. Si T: V —» V tiene la propiedad de que T 2 tiene un autovalor no negativo X 2 , demostrar 
que por lo menos uno de los dos valores X o — X es un autovalor para T. 

■ [ Indicacidn: T 2 - X 2 / = (T + \I)(T - X/).] 

5. Sea V el espacio lineal de todas las funciones reales derivables en (0,1). Si f £ V, defi- 
namos g = T(f) poniendo g(t) = tf'(t) para todo t en (0,1). Demostrar que todo X real 
es un autovalor de T, y determinar las autofunciones correspondientes a X. 

6. Sea V el espacio lineal de todos los polinomios reales p(x) de grado < n. Si p £ V, defi- 
namos q = T(p) poniendo q(t) = p(t + 1) para todo t real. Demostrar que T tiene sola- 
mente el autovalor 1. ^Cuales son las autofunciones pertenecientes a ese autovalor? 

7. Sea V el espacio lineal de todas las funciones continuas en ( —oo.+oo) y tales que la 
integral J* „ f(t)dt existe para todo x real. Si / e V definamos g = T(f) poniendo 
g(x) = J^_oo f(t)dt. Demostrar que todo X positivo es un autovalor para T y determinar 
las autofunciones correspondientes a X. 

8. Sea V el espacio lineal de todas las funciones continuas en ( — 00 ,+oo) y tales que la 
integral a, t f(t)dt exista para todo x real. Si / 6 V definamos g = T(f) poniendo 
g(x) = ft 00 tf(t)dt. Demostrar que todo X negativo es un autovalor para T y determinar 
las autofunciones correspondientes a X. 
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9. Sea V = C(0, it) el espacio lineal real de todas las funciones reales continuas en el in- 
tervalo [0, ir). Sea S el subespacio de todas las funciones / que admiten derivada se- 
gunda continua y que satisfacen tambien las condiciones de contomo /(0) = f(ir) — 0 . 
Sea T: S —>V la transformacion lineal que aplica cada / en su derivada segunda, 
T(f) = /". Demostrar que los autovalores de T son los numeros de la forma — n 2 , 
donde n — 1,2,..., y que las autofunciones correspondientes a — n 2 son /(f) = c„ sen nt , 
siendo c„ ^ 0 . 

10. Sea V el espacio lineal de todas las sucesiones convergentes {*„}. Definamos T: V —> V 
del modo siguiente: Si x = {x,} es una sucesidn convergente con limite a, T(x) = {y„}, 
siendo y„ — a — x„ para n> 1 . Demostrar que T tiene solo dos autovalores, X = 0 y 
X = — 1, y determinar los autovectores pertenecientes a cada uno de esos X. 

11. Supongamos que una transformacion lineal T tiene dos autovectores x e y pertenecien¬ 
tes a autovalores distintos X y p. Si ax + by es un autovector de T, demostrar que 
a = 0 o b = 0. 

12. Sea T: S-*V una transformacidn lineal tal que todo elemento no nulo de S es un 
autovector. Demostrar que existe un escalar c tal que T(x) — cx. Dicho de otro modo, 
la unica transformacidn con esta propiedad es el producto de la identidad por un 
escalar. [ Indicacidn: Hacer uso del ejercicio 11.] 


4.5 Caso de dimension finita. Polinomios caracteristicos 

Si dim V = n, el problema de determinar los autovalores de una transforma¬ 
cion lineal T: V -» V puede resolverse con la ayuda de los determinantes. Desea- 
mos hallar aquellos escalares A tales que la ecuacion T(x) — Xx tenga una solucion 
x O. La ecuacion T(x) = Xx puede escribirse en la forma 


(A/ - T)(x) = 0, 


donde / es la transformacion identidad. Si ponemos T x = XI — T, entonces A es 
un autovalor si y solo si la ecuacion 

(4.6) T x (x) = O 

tiene una solucion x no nula, en cuyo caso T- no es invertible (en virtud del 
teorema 2.10). Por consiguiente, segun el teorema 2.20, una solucion no nula de 

(4.6) existe si y solo la matriz de T x es singular. Si A es una representacion ma- 
tricial de T, entonces XI — A es una representacion matricial para T x . Segun el 
teorema 3.13, la matriz XI — A es singular si y solo si det (A I — A) — 0. Asi pues, 
si A es un autovalor para T debe satisfacer la ecuacion 

(4.7) det (XI — A) — 0. 

Reciprocamente, cualquier A del cuerpo fundamental de escalares que satisfaga 

(4.7) es un autovalor. Esto sugiere que el determinante det (XI — A ) deberfa estu- 
diarse como una funcion de A. 
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teorema 4.4. Si A es una matriz nXn cualquiera e I es la matriz identi- 
dad nXn, entonces la funcidn f definida por la ecuacidn 

/(A) = det {XI — A) 

es un polinomio en X de grado n. Ademas, el termino de mayor grado es A” y el 
termino independiente o constante es /(0) = det (—A) = ( — 1)" det A. 

Demostracion. La afirmacion /(0) = det (—A) resulta in m ediatamente de 
la definicion de /. Vamos a demostrar que / es un polinomio de grado n unica- 
mente para el caso n ^ 3. La demostracion en el caso general puede hacerse por 
induccion y la dejamos como ejercicio. (Ver ejercicio 9 de la seccion 4.8.) 

Para n = 1 el determinante es el polinomio lineal /(A) = A — a u . Para 
n = 2 tenemos 


det {XI - A) = 


X — a u —a 12 
a X — <* 22 


— {X — a u ){X — a 22 ) — a 12 a 21 

— X 2 — (a u + a 22 )X -f {a u a 22 — a 12 a 21 ), 
polinomio de segundo grado en A. Para n= 3 tenemos 
X an a 12 — a 13 


det {XI - A) = 


= (A - a u ) 


21 

~~ a 31 


' a 22 ^23 

^32 X fl 3s 


X Q,22 

a 23 

+ <*12 

**21 — <*23 

<*13 

— <*21 

X #22 

~ a 32 

X #33 


<*31 A — <*33 


— <*31 

“~#32 


Los dos ultimos terminos son polinomios de primer grado en A. El primer termino 
es un polinomio de tercer grado, siendo el termino de mayor grado A 3 . 

definicion. Si A es una matriz nXn el determinante 

f{X) = det {XI - A) 

se denomina polinomio caracteristico de A. 

Las raices del polinomio caracteristico de A son numeros complejos, alguno 
de los cuales puede ser real. Si designamos con F el campo real R o el campo 
complejo C, tenemos el teorema siguiente. 
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teorema 4.5. Sea T:V -* T una transformacidn lineal, siendo F el campo 
de escalares de V, y dim V=n. Sea A una representacion matricial de T. Entonces 
el conjunto de autovalores de T consta de aquellas raices del polinomio caracte- 
ristico de A que pertenecen a F. 

Demostracion. La discusion del teorema 4.4 pone de manifiesto que todo 
autovalor de T satisface la ecuacion det (A/ — A) — 0 y que cualquier raiz del 
polinomio caracteri'stico de A que pertenece a F es un autovalor de T. 

La matriz A depende de la eleccion de la base para V, pero los autovalores 
de T se definieron sin hacer referencia a una base. Por consiguiente, el conjunto de 
raices del polinomio caracteri'stico de A debe ser independiente de la eleccion de 
la base. Mas aun, en una seccion posterior demostraremos que el mismo polinomio 
caracteri'stico es independiente de la eleccion de base. Volvamos ahora al problema 
de calcular los autovalores y autovectores en el caso de dimension finita. 

4.6 Calculo de autovalores y autovectores en el caso de dimensidn finita 

En el caso de dimensidn finita los autovalores y autovectores de una trans¬ 
formacidn lineal T se llaman tambien autovalores y autovectores de la representa- 
cion matricial de T. Asi pues, los autovalores de una matriz cuadrada A son las 
raices del polinomio caracteristico /(A) = det (A/ — A). Los autovectores corres- 
pondientes a un autovalor A son aquellos vectores no nulos X = (x, ,.. . , x„) 
considerados como matrices columna n X 1 que satisfacen la ecuacion matricial 


AX = XX, o (XI - A)X = O . 

Este es un sistema de n ecuaciones lineales para los componentes x t ,..., x n . 
En cuanto se conoce A podemos obtener los autovectores resolviendo ese sistema. 
Seguidamente ofrecemos tres ejemplos que presentan aspecto distinto. 


ejemplo 1. Una matriz con todos sus autovalores distintos. La matriz 

2 i r 
A = I 2 3 4| 

-1 -1 -21 


tiene el polinomio caracteristico 

rX-2 

I 

det (XI — A) = det 


-1 -1 ' 
-2 X-3 -4 

1 1 X + 2 


— (X — 1)(2 + l)(X — 3), 
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con lo que existen tres autovalores distintos: 1, —1 y 3. Para hallar los autovec¬ 
tores correspondiente a A = 1 resolvemos el sistema AX — X, o 

2 1 11 [XI pcf 

2 3 4 x 2 — x 2 . 

— 1 —1 — 2J l_x 3 J [x 3 _ 

Esto nos da 

2x x + x 2 + x 3 — Xi 
2x x + 3x 2 + 4x 3 = x 2 

— *1 — *2 — 2*3 = X 3 , 
que podemos escribir en la forma 

+ x 2 + x 3 = 0 

2x x + 2x 2 + 4x 3 = 0 

—x 1 — x 2 — 3x 3 = 0. 


Sumando las ecuaciones primera y tercera encontramos x 3 = 0, y las tres ecua- 
ciones se reducen entonces a + x 2 = 0. Con lo cual, los autovectores corres- 
pondientes a A = 1 son X = f(l, —1,0), siendo t cualquier escalar no nulo. 

Mediante calculos parecidos encontramos los autovectores X = f(0, 1,-1) 
correspondientes aA. = -l,yX = t(2, 3, —1) correspondientes a A = 3, siendo 
t un escalar cualquiera no nulo. Puesto qile los autovalores son distintos los auto¬ 
vectores correspondientes (1,—1,0), (0, 1,—1) y (2,3,-1) son independien- 
tes. Los resultados pueden resumirse en forma de tabla de la manera siguiente. 
En la tercera columna se consigna la dimension del autoespacio E(A). 


Autovalor A 

Autovectores 

dim £( A) 

1 

/(I, — 1 , 0), 1 5*0 

1 

-1 

/(0,1,-D, 0 

1 

3 

/(2,3,-1), t/0 

1 


ejemplo 2. Una matriz con autovalores repetidos. La matriz 
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tiene el polinomio caracteristico 

- 2 1 -1 " 

0 2-3 1 = (2 - 2)(2 - 2)(2 - 4). 

-2 -1 2 — 3_ 

Los autovalores son 2, 2 y 4. (Citamos el autovalor 2 dos veces para destacar 
que es una rafz doble del polinomio caracteristico.) Para encontrar los autovecto¬ 
res correspondientes a A = 2 resolveremos el sistema AX = 2X, que se reduce a 

—+ x 3 = 0 

*2 — *3 = 0 

2x x + x 2 + X 3 = 0. 

Este tiene la solucion x 2 = x 3 ~ —x 1 con lo que los autovectores correspondien¬ 
tes a A = 2 son f( — 1, 1, 1), donde t # 0. Analogamente encontramos los auto¬ 
vectores t( 1, — 1, 1) correspondientes al autovalor A = 4. La tabla resumen es la 
siguiente: 

Autovalor A Autovectores dim E(A) 

2,2 #(-1,1,1), t# 0 1 

4 #(1,-1,1), t* 0 1 

ejemplo 3. Otra matriz con autovalores repetidos. La matriz 

1 r 

3 2 
3 4_ 

tiene el polinomio caracteristico (A — 1)(A — 1)(A — 7). Cuando A = 7 el siste¬ 
ma AX = IX se convierte 

5.Vj — Vo — x 3 0 

—2x 1 + 4x 2 — 2x 3 = 0 
—3*3 — 3* 2 + 3x 3 = 0. 

Este tiene-la solucion x 2 = 2x, ,x 3 = 3x,, asi que los autovectores correspondien- 
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tes a A = 7 son 1(1,2,3), donde t ¥= 0. Para el autovalor A = 1, el sistema 
AX = X consta de la ecuacion 


+ *2 + *3 = 0 

repetida tres veces. Para resolver esta ecuacion podemos tomar x, = a, x 2 = b, 
donde a y b son arbitrarios, y tomamos entonces x 3 — — a — b. Asi, todo auto¬ 
vector correspondiente a A = 1 tiene la forma 

(a, b, —a — b) = a( 1,0, -1) + b(0, 1,-1), 


siendo a =£■ 0 o b 0. Esto significa que los vectores (1,0, — 1) y (0, 1, — 1) 
forman una base para E(l). Luego dim£(A) = 2 cuando A = 1. Los resultados 
pueden resumirse asi: 

Autovalor Autovectores dim E( A) 

7 1(1, 2, 3), t =*0 1 

1,1 a(l, 0, — 1) + b( 0, 1,-1), a, b no ambos 0. 2 

Observese que en este ejemplo existen tres autovectores independientes pero sola- 
mente dos autovalores distintos. 

4.7 Traza de una matriz 

Sea /(A) el polinomio caracteristico de una matriz A, nXn. Designemos las 
n raices de /(A) por \ x ,... ,K, repitiendo cada raiz multiple las veces que indi- 
que su orden de multiplicidad. Tenemos entonces la factorizacidn 


/(A) = (A-A 1 )---(A-2 n ). 


Tambien podemos escribir /(A) en potencias decrecientes de A como sigue, 

/(A) = A” -f c n _ x \ n -' + • • • + c,A + c 0 . 

Comparandolo con la forma factorizada encontramos que el termino independien- 
te c 0 y el'coeficiente de A”- 1 vienen dados por las formulas 

= (—1)”A X • • • A„ y c„_! = ~(Aj + • • • + A„). 



132 


Autovalores y autovectores 


Puesto que tambien tenemos c 0 — (- l) n det A, vemos que 

^1 • • • A„ = det A . 

Esto es, el producto de las rakes del polinomio caracterlstico de A es igual al 
determinante de A. 

La suma de las raices de /(A) se llama traza de A, y se designa con tr A. Asi 
pues, por definition 


tr a = J A,. 

«-i 

El coeficiente de A" 1 viene dado por c„- 1 = —tr A. Tambien podemos calcular 
este coeficiente partiendo de /(A) en forma de determinante y encontramos 

c n-i — — («u + • • • + a n „). 

(En el ejercicio 12 de la section 4.8 se pide una demostracion de esa formula.) 
Las dos formulas de c„- 1 demuestran que 

tr A = %a it . 

«=i 

Esto es, la traza de A es tambien igual a la suma de los elementos diagonales de A. 

Puesto que la suma de los elementos diagonales es facil de calcular, puede 
utilizarse como una comprobacion numerica en los calculos de autovalores. En los 
ejercicios que siguen veremos otras propiedades de la traza. 


4.8 Ejercicios 


Determinar los autovalores y los autovectores de cada una de las matrices de los ejer¬ 
cicios 1 al 3. Asimismo, para cada autovalor X calcular la dimensidn del autoespacio E(\). 


‘1 01 

1. a) , b) 

0 lj [i 

fl a 

2. , a > 0, b > 0 
' b \ 

r° 

4. Las matrices P x — 


cos 6 —senfl 


_ 0 ~ f 

J °. ’ 


0 -1 


se presentan en la 
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teorfa cudntica del Spin electrdn y se denominan matrices spin de Pauli, en honor del 
fi'sico Wolfgang Pauli (1900-1958). Comprobar que tienen los mismos autovalores 1 y — 1. 
Determinar entonce* todas las matrices 2X2 con elementos complejos que tengan los 
dos autovalores 1 y — 1. 

5. Determinar todas las matrices 2x2 con elementos reales cuyos autovalores sean a) reales 
y distjntos, b) reales e iguales, c) complejos conjugados. 

6. Determinar a, b, c, d, e, / sabiendo que los vectores (1, 1,1), 1, 0, —1) y (1, —1, 0) son 
autovectores de la matriz 


'1 1 r 

a b c 
d e f 

7. Calcular los autovalores y autovectores de cada una de las matrices siguientes. Tambien, 
calcular la dimensidn del autoespacio £(X) para cada autovalor X. 


'1 0 o’ 


"2 1 3" 


5 -6 -6" 

-3 1 0 

, b) 

1 2 3 

, c) 

-14 2 

4 -7 1 


I 

<*> 


1 

VO 

1 

ro 


8. Calcular los autovalores de cada una de las cinco matrices 



'0 

0 

1 

O' 


‘1 

0 

0 

O' 


'0 

i 

0 

0* 


0 

0 

0 

1 


0 

1 

0 

0 


1 

0 

0 

0 

a) 

1 

0 

0 

0 

, b) 

0 

0 

-1 

0 

. c) 

0 

0 

0 

1 


0 

1 

0 

0. 


0 

0 

0 

-1. 


0 

0 

1 

0. 



'0 

—i 

0 

O' 


‘1 

0 

0 

0 * 


i 

0 

0 

0 


0 

-1 

0 

0 

d) 

0 

0 

0 

— i 

. e) 

0 

0 

1 

0 


o 

0 

i 

0 . 


0 

0 

0 

- 1 . 


Estas se llaman matrices de Dirac en honor de Pablo A. M. Dirac (1902- ), ffsico 
inglfis. Se presentan en la resoluci6n de la ecuaci6n de ondas relativists en Mecanica 
Cuantica. 

9. Si A y B son matrices nxn, siendo B una matriz diagonal, demostrar (por inducci6n) 
que el determinante /(X) = det(Xfl — A) es un polinomio en X con /(0) = (—1)” det A, 
y con el coeficiente de X’ igual al producto de los elementos diagonales de B. 

10. Demostrar que una matriz cuadrada A y su transpuesta A‘ tienen el mismo polinomio 
caracteristico. 

11. Si A y B son matrices nxn siendo A no singular, demostrar que AB y BA tienen el 
mismo conjunto de autovalores, incluso si A es singular, pero no es necesario demos¬ 
trar esto ultimo. 



134 


Autovalores y autovectores 


12. Sea A una matriz nxn con polinomio caracteristico /(X). Demostrar (por induction) 
que el coeficiente de A nl en f(X) es — tr A. 

13. Sean A y B dos matrices nxn tales que det A = det B y tr A — tr B. Demostrar que 
A y B tienen el mismo polinomio caracteristico si n = 2 pero que esto no es seguro 
si n > 2. 

14. Demostrar cada una de las siguientes proposiciones relativas a la traza. 

a) tr (A + B) = tr A + tr B. 

b) tr ( cA ) = c tr A. 

c) tr (AB) = tr (BA). 

d) tr A 1 — it A. 


4.9 Matrices que representan la misma transformacion lineal. Matrices lineales 

En esta section demostramos que dos representaciones matriciales distintas 
de una transformacion lineal tienen el mismo polinomio caracteristico. Para ello 
estudiamos con mayor cuidado la relation entre las matrices que representan la 
misma transformacion. 

Recordemos cdmo se definen las representaciones matriciales. Supongamos 
que T: V W sea una aplicacion de un espacio ra-dimensional V en un espacio 
m-dimensional W. Sean (e, ,..., e„) y (w, ,..., w m ) bases ordenadas para V y 
W respectivamente. La representacion matricial de T relativa a las bases elegidas 
es la matriz mXn cuyas columnas constan de los componentes de TieJ ,, T(e„) 
respecto a la base (w x ,..., w m ). Partiendo de bases distintas se obtienen repre¬ 
sentaciones matriciales distintas. 

Consideremos ahora el caso en el que V = W, y supongamos que se utiliza la 
misma base ,..., e„) para V y para W. Sea A — (a ik ) la matriz de T relativa 
a esta base. Esto significa que 


(4.8) 


n 


T( e k) = 2 

i=l 


para k 


1,2,... ,n. 


Elijamos ahora otra base (u a ,. .., u„) para V y W y sea B = (b kj ) la matriz de T 
relativa a esta nueva base. Entonces tenemos 


T( u j) ~2^ki u k 


k -1 


para j = 1, 2,..., n. 


(4.9) 
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Ya que cada «,• pertenece al espacio engendrado por e x ,... ,e„ podemos es- 
cribir 

n 

(4-10) Uj =2c kj e k para j = 1, 2,. . . , n, 

k=l 

para un cierto conjunto de escalares c*,-. La matriz nXn C = (c*/) determinada 
por esos escalares es no singular puesto que representa una transformacion lineal 
que aplica una base de V en otra base de V. Aplicando T a los dos miembros de 

(4.10) tambien obtenemos las ecuaciones 


(4.11) T(u,) =Zc kj T(e k ) para j = 1,2 . n. 

k =1 

Los sistemas de ecuaciones del (4.8) al (4.11) pueden escribirse con mayor 
simplicidad en forma matricial introduciendo matrices cuyos elementos sean vec- 
tores. Sean 


E=[e 1 ,...,e n ] y U=[u 1 ,..., u n ] 


matrices fila 1 Xn cuyos elementos son los de la base que se considera. Entonces 
el conjunto de ecuaciones (4.10) puede escribirse mediante una ecuacion matricial 
unica, 


(4.12) U = EC. 

Analogamente, si introducimos 

E' = [Tie,),..., T{e n )] y [/' = [r(« x ),... , T{u n )], 

Las ecuaciones (4.8), (4.9) y (4.11) se convierten respectivamente en 

(4.13) E' = EA, U' = UB, U' = E'C. 

A partir de (4.12) tambien se obtiene 


E = VC~ l . 
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Para hallar la relacidn entre Ay B expresamos U' de dos maneras en funcion 
de U. De (4.13) tenemos 


y 


U' = UB 

V = E’C = EAC = t/C-MC. 


Por lo tanto UB = UC^AC. Pero cada elemento en esta ecuacidn matricial es una 
combinacidn lineal de los vectores base u lf ... ,u„. Puesto que los «,• son inde- 
pendientes debe ser 


B = C-MC. 

Con ello, hemos demostrado el siguiente teorema. 

teorema 4.6. Si dos matrices nXn A y B representan la misma transfor¬ 
mation lineal T, existe una matriz no singular C tal que 

B = C-'AC. 

Ademas, si A es la matriz de T relativa a una base E = [gj,..., e„] y B la 
matriz de T relativa a la base U = [th ,... ,u n ], entonces como C podemos tomar 
la matriz no singular que relaciona las dos bases a traves de la ecuacion matricial 
U = EC. 

Tambien es cierto el reci'proco del teorema 4.6. 

teorema 4.7. Sean A y B dos matrices nXn relacionadas por una ecuacion 
de la forma B = C -1 AC, en la que C es una matriz nXn no singular. Entonces 
A y B representan la misma transformacidn lineal. 

Demostracidn. Elijamos una base E = [e x ,..., e„] para un espacio n-di- 
mensional V. Sean u x ,... ,Un los vectores determinados por las ecuaciones 

n 

( 4 - I4 > “i = 2 P ara J = 1.2. n, 

*=“1 

en donde los escalares c*,- son los elementos de C. Puesto que C es no singular re- 
presenta una transformacidn lineal invertible, asf que U = [«!,...,«»] es tam¬ 
bien una base para V, y tenemos U = EC. 

Sea T la transformacidn lineal que tiene A como representacion matricial 
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respecto a la base E, y sea S la transformacidn lineal que tiene B como represen¬ 
tation matricial relativa a la base V. Tenemos entonces 

(4.15) T(e k ) = Za ik < para k = 1, 2,..., n 

y 

n 

(4.16) S(u j )=Zb kl u k para j = 1,2 . n. 

k -1 

Demostraremos que S — T probando que T(u,) = S(«,) para cada /'. 

Las ecuaciones (4.15) y (4.16) pueden escribirse en forma matricial como 
sigue, 

[T( ei ), .... T(e n )] = EA, [S(u k ), ..., S(«J] = UB. 

Aplicando T a (4.14) se obtiene tambien la relacion T(u,) = ^ CkjT(e k ), o 

(n»i),.... T{u n )) = EAC. 

Pero tenemos 

UB = ECB = ECiC^AC) = EAC, 

que demuestra que T(«,) = S(Uj) para cada /. Por consiguiente, T(x) — S(x) para 
cada x de V, con lo que T — S. Dicho de otro modo, las matrices A y B repre¬ 
sentan la misma transformation lineal. 

definici6n. Dos matrices nXn A y B se llaman semejantes si existe una 
matrix no singular C tal que B = C _1 AC. 

Los teoremas 4.6 y 4.7 pueden combinarse dandonos el siguiente 

teorema 4.8. Dos matrices nXn son semejantes si y sdlo si representan la 
misma transformation lineal 

Las matrices semejantes tienen muchas propiedades. Por ejemplo, tienen el 
mismo determinante puesto que 

det (C-L4C) = det (C^Xdet A)( det C) = det A. 

Esta propiedad nos da el teorema siguiente. 

teorema 4.9. Las matrices semejantes tienen el mismo polinomio caracte- 
ristico y por tanto los mismos autovalores. 



138 


Autovalores y autovectores 


Demostracion. Si A y B son semejantes existe una matriz no singular C 
tal que B — C~ l AC. Por consiguiente, tenemos 


XI- B = XI- C~ l AC = XC-UC - C~ l AC = C~\XI - A)C. 


Esto prueba que A I—B y A/—A son semejantes, as! que det (A/— B) = det (A I—A). 

Los teoremas 4.8 y 4.9 prueban que todas las representaciones matriciales 
de una transformacion lineal dada T tienen el mismo polinomio caracteristico. 
Este polinomio tambien se llama el polinomio caracteristico de T. 

El teorema que sigue es una combinacion de los teoremas 4.5, 4.2 y 4.6. 
En el teorema 4.10, F representa bien el cuerpo real R o el cuerpo complejo C. 

teorema 4.10. Si T:V V es una transformacion lineal, siendo F el 
cuerpo de escalares de V y dim V—ny suponemos que el polinomio caracteristico 
de T tiene n raices distinta Ai,. A„ en F, entonces-. 

a) Los autovectores correspondientes u t ,..., u„ forman una base para V. 

b) La matriz de T relativa a la base U = [iq ,..., u„] es la matriz diago¬ 
nal A que tiene los autovalores como elementos diagonales: 

A = diag (X x ,... ,X n ). 

c) Si A es la matriz de T relativa a otra base E — [e ± ,..., e„], entonces 

A = C-L4C, 

donde C es la matriz no singular que relaciona las dos bases mediante 
la ecuacion 


U — EC. 

Demostracidn. Segun el teorema 4.5 cada rafz A, es un autovalor. Puesto 
que existen n raices distintas, el teorema 4.2 nos dice que los autovectores corres¬ 
pondientes son independientes. Luego forman una base para V. Esto 

demuestra a). Como T(Ui) = ^iUi, la matriz de T relativa a U es la matriz diagonal 
A,lo que demuestra b). Para demostrar c) utilizamos el teorema 4.6. 

Observacidn: La matriz no singular C del teorema 4.10 se llama matriz diagonali- 
zante. Si (e,,..., e„) es la base de los vectores coordenados unitarios (I,,, /„), en¬ 
tonces la ecuacion U = EC del teorema 4.10 demuestra que la columna k de C consta 
de los componentes de los autovectores u* relativos a (L ,..., /„). 

Si los autovalores de A son distintos, entonces A es semejante a una matriz 
diagonal. Si los autovalores no son distintos, A podrla hacerse semejante a una 
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matriz diagonal. Esto sucedera si y solo si existen k autovectores independientes 
correspondientes a cada autovalor de multiplicidad k. Vamos a ver ejemplos en 
los ejercicios que siguen. 

4.10 Ejercicios 


1. Demostrar que las matrices 


1 

0 


1 

1 



tienen los mismos autovalores pero no 


son semejantes. 

2. Hallar en cada caso una matriz no singular C tal que C~'AC es una matriz diagonal o 
justificar por que tal matriz C no existe 


(a) A = 


1 

1 


0 

3 


(b) A = 


1 

5 


2 

4 


(c) A = 



1 

4 


(d) A = 



1' 

0 


3. Se dan en el piano tres bases. Con respecto a esas bases un punto tiene como compo- 
nentes (*i,x 2 ), (yi, yd, y (z 2 , z 2 ) respectivamente. Supongamos que [yi, y 2 ] = [xi, xi]A, 
[zi, z 2 ] = [xi,x 2 ]B, y [zi, z 2 ] = [yi, y 2 ]C siendo A, B, C matrices 2x2. Expresar C en 
funcion de A y B. 

4. En cada caso, demostrar que los autovalores de A no son distintos pero que A tiene tres 
autovectores independientes. Hallar una matriz no singular C tal que C 'AC sea una 
matriz diagonal. 



"0 

0 

f 


1 

-1 

-f 

a) A — 

0 

1 

0 

, b) A = 

1 

3 

1 


1 

0 

0 


-1 

-1 

1 


5. Demostrar que ninguna de las matrices siguientes es semejante a una matriz diagonal. 


pero que cada una es semejante a una matriz triangular de la forma 
es un autovalor. 


A 

1 


O' 

A 


en la que X 



I 

7 

CN 

1_ 


1 - 

T—< 

<N 

a) 

1 o 

K> 

1_ 

b) 

i 


0 -1 01 


6 . 


Determinar los autovalores y los autovectores de la matriz 
demostrar que no es semejante a una matriz diagonal. 



0 

-3 


1 y con ello 


3 


7. a) Demostrar que una matriz cuadrada A es no singular si y sdlo si 0 no es autova¬ 
lor de A. 
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b) Si A es no singular, demostrar que los autovalores de Ar 1 son los reciprocos de los 
autovalores de A. 

8. Dada una matriz A nXn con elementos reales tal que A 1 = —I. Demostrar las propo- 
siciones siguientes referentes a A. 

a) A es no singular. 

b) n es par. 

c) A no tiene autovalores reales. 

d) detA = 1. 
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AUTOVALORES DE OPERADORES 
EN ESPACIOS EUCLfDEOS 


5.1 Autovalores y productos interiores o escalates 

Este capi'tulo se ocupa de algunas propiedades de los autovalores y autovec- 
tores de las transformaciones lineales que operan en espacios euclideos, esto es, 
en espacios lineales que tienen producto interior o escalar. Recordemos las propie¬ 
dades fundamentals de los productos interiores. 

En un espacio euclideo real un producto interior (x,y) de dos elementos x e y 
es un numero real que satisface las propiedades siguientes: 

(1) (x,y) = (y, x ) (simetria) 

(2) (x + z,y) = (x,y) + (z,y) (linealidad) 

(3) (cx, y) = c(x, y) (homogeneidad) 

(4) (x, x) > 0 if x O (positividad). 

En un espacio euclideo complejo el producto interior es un numero complejo 
que satisface las mismas propiedades, con la exception de que la simetria se reem- 
plaza por la simetria de Hermite o hermitiana, 

(1') (*,j) = O'.*). 

en donde la barra representa el complejo conjugado. En 3) el escalar c es complejo. 
De (1') y (3) obtenemos 

(30 (*> cy) = c(x, y ), 

que nos dice que los escalares son conjugados cuando se sacan del segundo factor. 
Haciendo en (10 x = y vemos que (x, x) es real, con lo que la propiedad (4) tiene 
sentido si el espacio es complejo. 

Cuando hablamos de espacio euclideo, sin mas, se sobreentiende que el 
espacio puede ser real o complejo. Si bien la mayor parte de nuestras aplicaciones 
se haran en espacios de dimension finita, no impondremos esa restriccion a priori. 
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El primer teorema demuestra que los autovalores (si existen) pueden expre- 
sarse en funcion del producto interior. 

teorema 5.1. Si E es un espacio euclideo, V un subespacio de E y consi- 
deramos una transformation lineal T:V E que tenga un autovalor X con un 
correspondiente autovector x, entonces 

(5.1) A - . 

(x,x) 

Demostracion. Puesto que T(x) = Xx tenemos 


( T{x ), x) — (Xx, x) = X(x, x). 


Como x¥= O podemos dividir por (x, x) obteniendo (5.1). 


Varias propiedades de los autovalores se deducen facilmente a partir de la 
ecuacion (5.1). Por ejemplo, de la simetria hermitiana del producto interior te¬ 
nemos la formula analoga 


(5.2) 


l = (x, T(x)) 
(x, x) 


para el complejo conjugado de X. De (5.1) y (5.2) deducimos que X es real 
(A = X) si y solo si (T(x), x) es imaginario puro, esto es, si y solo si 


(T(x), x) — (x, T(x)) para el autovector x. 

(Esta condicion se cumple en un espacio euclideo real). Tambien, A es imaginario 
puro (X——X) si y solamente si (T(x), x) es imaginario puro, lo que es lo mismo, 
si y solamente si 


(T(x), x) — — (x, T(x)) para el autovector x. 

5.2 Transformaciones hermitianas y hemi-hermitianas 

En esta seccion introducimos dos tipos importantes de operadores lineales 
que actuan en espacios euclideos. Esos operadores tienen dos categorias de deno- 
minaciones, que dependen de si el espacio euclideo fundamental tiene producto 
interior real o complejo. En el caso real las transformaciones se llaman simetricas 
o hemi-simetricas. En el caso complejo se llaman hermitianas o hemi-hermitianas. 
Esas transformaciones se presentan en multitud de" aplicaciones distintas. Por 
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ejemplo, los operadores hermitianos en espacios de dimension infinita desempe- 
nan un importante papel en Mecanica Cuantica. Discutiremos en primer lugarel 
caso complejo ya que no presenta nuevas dificultades. 

definici6n. Sean E un espacio euclideo y V un subespacio de E. Una 
transformation lineal T: V E se llama hermitiana en V si 

(T(x)>y) — (*> r (y)) para iodo x y todo y de V. 

El operador T se llama hemi-hermitiano en V si 

( T(x),y ) = —(x, T{y )) para iodo x y todo y de V. 

Dicho de otro modo, un operador hermitiano T puede pasarse de un factor 
de un producto interior al otro sin modificar el valor del producto. Tal paso en 
el caso de un operador hemi-hermitiano cambia el signo del producto. 

Observacidn: Como ya se ha mencionado, si E es un espacio euclideo real, las trans¬ 
formaciones hermitianas tambien se llaman simetricas; las transformaciones hemi-hermi¬ 
tianas se llaman hemi-simetricas. 

ejemplo 1. Simetria y hemi-simetria en el espacio C(a, b). Sea C(a, b) 
el espacio de todas las funciones reales continuas en un intervalo cerrado [ a, f>], 
con el producto interior real 


(/. g) = J7(0g(0 dt. 

J a 

Sea V un subespacio de C(a, b). Si T: V -*■ C(a, b ) es una transformacion lineal, 
entonces (/, T(g)) =J* f(t)Tg(t)dt, donde hemos escrito Tg(t) en lugar de T(g)(0 
Por consiguiente, las condiciones para la simetria y la hemi-simetria se convier- 
ten en 

(5-3) J a { f(t)Tg(t ) — g(t)Tf(t)} dt = 0 si T es simetrica, 

y 

(^•4) J a {/(OTg(t) + g(t)Tf(t)} dt — 0 si T es hemi-simetrica. 

ejemplo 2. Multiplication por una funcion fija. En el espacio C(a, b) del 
ejemplo 1, elijamos una funcion fija p y definamos T(/) = pf, producto de p y f. 
Para esa T, la ecuacion (5.3) se satisface cualesquiera que sean / y g en C(a, b) 
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nuesto que el integrando es cero. Por consiguiente, la multiplicacion por una fun- 
cion fija es un operador simetrico. 

ejemplo 3. El operador derivada. En el espacio C(a,b) del ejemplo 1, 
sea V el subespacio de todas las funciones / que tienen derivada-continua en el 
intervalo abierto (a, b) y que satisfacen tambien la condicion de contorno 
f(a) = f(b). Sea D: V C(a, b ) el operador derivada dado por D(/) = f. Resulta 
sencillo demostrar que D es hemi-simetrico. En este caso el integrando de (5.4) es 
la derivada del producto fg, por lo cual la integral es igual a 

£ (fg)'(t) dt = f(b)g(b) - f(a)g(a ). 


Puesto que / y g satisfacen ambas la condicion de contorno, tenemos 
f(b)g(b) — j{a)g(a) = 0. Asi pues, la condicion de contorno implica la hemi-sime- 
tria de D. Las funciones constantes son las unicas autofunciones en el subespa¬ 
cio V. Pertenecen al. autovalor 0. 

ejemplo 4. Operadores de Sturm-Liouville. Este ejemplo es importante 
en la teoria de las ecuaciones diferenciales lineales de segundo orden. Utilicemos 
una vez mas el espacio C(a, b ) del ejemplo 1 y sea V el subespacio de todas las 
funciones / que tienen derivada segunda continua en [a, 6] y que satisfacen las 
condiciones de contorno 

(5.5) p(a)f(a) = 0, p(b)f(b) = 0, 

siendo p una funcion fija de C(a, b) con derivada continua en [a, b]. Sea q otra 
funcion fija en C(a, b) y sea T: V -> C(a, b) el operador definido por la ecuacion 

T(f) = (pfy + qf. 


Este se llama operador de Sturm-Liouville. Para averiguar su simetrfa observemos 
que fT(g) — gT(f) = fipg'Y — g(pf')'. Utilizando este resultado en (5.3) e inte¬ 
grando por partes, encontramos 

f { fng ) - gn/)} dt = f P g’ I®- j b a pgr dt - g P f f+ £ pf'g r dt = o, 

ya que tanto / como g satisfacen las condiciones de contorno (5.5). Por tanto 
T es simetrico en V. Las autofunciones de T son aquellas funciones no nulas 
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/ que satisfacen, para un cierto valor real A, una ecuacion diferencial de la forma 

(p/y + qf=v 

en [a, fe], y las condiciones de contorno (5.5). 

5.3 Autovalores y autovectores de los operadores hermitianos y hemi-hermitianos 

En cuanto a los autovalores tenemos el siguiente teorema: 

teorema 5.2. Si T tiene un autovalor A, entonces : 

a) Si T es hermitiano, A es real: A = A. 

b) Si T es hemi-hermitiano, A es imaginario puro: A = — A. 

Demostracidn. Sea x un autovector correspondiente a A. Tenemos entonces 

- (T(x), x) .. - (x, T(x)) 

/. — - y a =-. 

(x, x) (x, x) 

Si T es hermitiano tenemos (T(x), x) = (x, T(x)) asi que A = A. Si T es hemi- 
hermitiano tenemos (T(x), x) = — (x, T(x)) con lo cual A = — A. 

Observation: Si X es simetrico, el teorema 5.2 nada nuevo nos dice acerca de los 
autovalores de X puesto que todos los autovalores deben ser reales si su producto interior 
es real. Si T es hemi-simtirico, los autovalores de T deben ser a un tiempo reales e 
imaginarios puros, luego deben ser cero (si existen). 


5.4 Ortogonalidad de los autovectores correspondientes a autovalores distintos 

Los autovalores distintos de una transformacion lineal cualquiera correspon- 
den a autovectores independientes (segun el teorema 4.2). Para las transforma- 
ciones hermitianas y hemi-hermitianas podemos decir aun mas. 

teorema 5.3. Si T es una transformacion hermitiana o hemi-hermitiana 
y si A y fx. son autovalores distintos de T con los autovectores correspondientes 
x e y, entonces x e y son ortogonales; esto es (x, y) = 0. 

Demostracidn. Escribamos T(x) = Ax, T(y) — v-y y comparemos los dos 
productos interiores (T(x), y) y (x, T(y)). Tenemos 


( T(x),y ) = (hc,y) = A(x, y) 


y 


(x, T(y)) = (x, py) = fi(x,y). 
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Si T es hermitiana esto nos da A(x, y) = p{x,y ) = p(x, y) ya que p — p. Por con- 
siguiente (x, y) = 0 puesto que *■¥= p. Si T es hemi-hermitiana obtenemos 
\(x, y) = — p(x,y ) = p(x, y) que implica tambien (x, y) = 0 . 

ejemplo. Apliquemos el teorema 5.3 a aquellas funciones no nulas que 
satisfacen una ecuacion diferencial de la forma 

(5.6) (pfj + qf — A/ 

en un intervalo [ a , 6], y que satisfacen tambien las condiciones de contorno 
p(a)f(a) = p(b)f(b) = 0. La conclusion es que dos soluciones cualesquiera / y g 
correspondientes a dos valores distintos de A son ortogonales. Por ejemplo, con- 
sideremos la ecuacion diferencial del movimiento armonico simple 

f" + k 2 f — 0 

en el intervalo [0, tt], siendo k¥= 0 . fista tiene la forma (5.6) con p = 1, q = 0, 
y A = — k 2 . Todas las soluciones vienen dadas por }(l) = c ± cos kt + c 2 sen kt. 
La condicion de contorno /(0) = 0 implica c x = 0. La segunda condicion de 
contorno, /(tt) = 0, implica c 2 sen kir = 0. Puesto que c 2 # 0 para una solucion 
no nula, debe ser sen k-n- = 0, lo que indica que k es entero. Dicho de otro 
modo, las soluciones no nulas que satisfacen las condiciones de contorno existen si 
y solo si k es entero. Esas soluciones son f{t) = sen nt, n — ±1, ±2, .... La con¬ 
dicion de ortogonalidad que el teorema 5.3 implica, se transforma ahora en la 
relacion conocida 


I sen nt sen mt dt = 0 

si m 2 y n 2 son enteros distintos. 

5.5 Ejercicios 


1. Sean E un espacio euclfdeo y V un subespacio, y sea T: V-*E una transformacidn 
lineal dada. Sean X un escalar y x un elemento no nulo de V. Demostrar que X es un 
autovalor de T, con x como autovector, si y solo si 

( T(x),y ) = A(x, y) para todo y del?. 

2. Sea T(x) = cx para todo x un espacio lineal V, siendo c un escalar fijado. Demostrar 
que T es simetrico si V es un espacio euclfdeo real. 

3. Supongamos que T: V —» V es una transformacion hermitiana. 

a) Demostrar que T“ es hermitiana para todo entero positivo n, y que T ' es hermitiana 
si T es invertible. 

b) iQue puede decirse de T* y de T ' si T es hemi-hermitiana? 



Ejercicios 


147 


4. Sean T,: V —> E y T 2 : V —> E dos transformaciones hermitianas. 

a) Demostrar que aT, + bT 2 es hermitiana para todo par de escalares reales a y b. 

b) Demostrar que el producto (la composicion) T 1 T 1 es hermitiana si Ti y Ti son permu- 
tables, esto es, si T,T 2 = T 2 T,. 

5. Sea V = V 3 (R) con el producto escalar ordinario como producto interior. Sea T una 
simetria en el piano xy; esto es, T(i) =/, T(j ) = j y T(k) = —k. Demostrar que T 
es simetrica. 

6. Sea C(0, 1) el espacio lineal real de todas las funciones continuas en [0,1] con producto 
interior (/, g) =J* f(t)g(t)dt. Sea V el subespacio de todas las / tales que JJ f(t)dt = 0. Sea 
T : V —> C( 0,1) el operador integracion definido por Tf(x) = Jg j(t)dt. Demostrar que T 
es hemi-simetrica. 

7. Sea V el espacio euclfdeo real de todos los polinomios con el producto interior 
(f>S)=!-i/(Og(t)dt. Determinar cuales de las siguientes transformaciones T:V-^V son 
sim^tricas o hemi-simetricas; 

a) Tf(x) =/(-*). c) Tf(x) =/(x) +f(-x). 

b) Tf(x) =f(x)f(-x). d) Tf(x) =/(*) -f(-x). 

8. En el ejemplo 4 de la secci6n 5.2, modificar el producto interior ast: 


(f’g) = f 6 f(t)g(t)w{t)dt, 

J a 

siendo w una funcidn positiva iijada perteneciente a C(a, b). Modificar el operador T de 
Sturm-Liouville escribiendo 


T (f) = ( lO +q f ' 

w 

Demostrar que el operador modificado es simdtrico en el subespacio V. 

9. Sea V un subespacio de un espacio euclideo complejo E. Sea T: V —> E una transfor- 
macion lineal y definamos una funcion de valores escalares Q en V, como sigue: 

Q(x) = (T(x), x) para todo x de V. 

a) Si T es hermitiana en V, demostrar que Q(x) es real para todo x. 

b) Si T es hemi-hermitiana, demostrar que O(x) es imaginaria pura para todo x. 

c) Demostrar que Q(tx)=ttQ(x) para todo escalar t. 

d) Demostrar que Q(x + y) =-Q(x) + Q(y) + (T(x),y) + (T( y),x), y hallar la formula 
analoga para Q(x + ty). 

e) Si Q(x) = 0 para todo x demostrar que T(x) = O para todo x. 

/) Si Q(x) es real para todo x demostrar que T es hermitiana. [Indication: Utilizar 
la propiedad de que Q(x + ty) es igual a su conjugada para todo escalar (.] 

10. Este ejercicio pone de manifiesto que los polinomios de Legendre (introducidos en la 
seccion 1.14) son autofunciones de un operador de Sturm-Liouville. Los polinomios de 
Legendre se definen mediante la ecuacion 

Pn(t) = 2bA n)(t) \ donde /«« = (f 2 -i) n . 

a) Comprobar que (t 2 — !)/'„( t) = 2ntf„(t). 
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b) Derivar la ecuaci6n del apartado a) n + 1 veces, mediante la fdrmula de Leibniz 
(ver p. del Volumen I) con lo que se obtiene 


(/ 2 _ i)/<«+ 2 >(,) + 2 i(„ + l)/^+i>W + n{n + iy W(0 

= 2 ntf^+'\t) + 2n(n + l)/^>(/). 

c) Demostrar que la ecuacidn del apartado b) puede ponerse en la forma 

t(/ 2 - l)p;«r = n(n + l)P n (0. 

Esto demuestra que P„(f) es una autofunci6n del operador de Sturm-Liouville dado en 
el intervalo [-1,1] por medio de T(f) = ( pf )', siendo p(t) = f - 1. La autofuncidn 
P„(t) pertenece al autovalor X = n(n + 1). En este ejemplo las condiciones de contomo 
para la simetrfa se satisfacen automdticamente puesto que p(l) = p(— 1) = 0. 


5.6 Existencia de un con junto ortonormal de autovectores para operadores hermi- 

tianos y hemi-hermitianos que actuan en espacios de dimension finita 

Los dos teoremas 5.2 y 5.3 se fundamentan en la hipotesis de que T tiene 
un autovalor. Como sabemos, los autovalores no existen necesariamente. No obs¬ 
tante si T actua en un espacio complejo de dimension finita, entonces existen 
siempre los autovalores puesto que son las raices del polinomio caracteristico. 
Si T es hermitiano, todos los autovalores son reales. Si T es hemi-hermitiano, 
todos los autovalores son imaginarios puros. 

Tambien sabemos que dos autovalores distintos pertenecen a autovectores 
ortogonales, si T es hermitiano o hemi-hermitiano. Usando esta propiedad se 
puede probar que T tiene un conjunto ortonormal de autovectores que engendran 
todo el espacio. (Recordemos que un conjunto ortogonal se llama ortonormal si 
cada uno de sus elementos tiene norma 1.) ' 

teorema 5.4. Supongamos que dim V = n y sea T: V V hermitiano o 
hemi-hermitiano. Existen entonces n autovectores u x ,... ,u„ de T que forman 
una base ortonormal para V. Por tanto, la matriz de T relativa a esta base es la 
matriz diagonal A = diag ,..., K), en donde A* es el autovalor perteneciente 
a u k . 


Demostracidn. Utilicemos el metodo de induccidn respecto a la dimensidn 
n . Si n = 1 , entonces T tiene exactamente un autovalor. Cualquier autovector 
u, de norma 1 es una base ortonormal para V. 

Supongamos ahora el teorema cierto para todo espacio euclideo de dimen- 
sidn n — 1. Para demostrar que es cierto para V elijamos un autovalor A x para 
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T y un autovector correspondiente u ± de norma 1. Entonces T(u,_) = ^iU t y 
HujII = 1 . Sea S el subespacio engendrado por u x . Aplicaremos la hipotesis de 
induccion al subespacio S 1 - que consta de todos los elementos de V que son orto- 
gonales a u t , 


S 1 = {x I X e V, (x, Uj) = 0}. 


Para ello necesitamos saber que dim S 1 - = n-1 y que T aplica S 1 en si mismo. 

Segun el teorema 1.7 a) sabemos que es parte de una base para V, sea 
esta la base (u,, v 2 , • • •, v„). Podemos suponer, sin perdida de generalidad, que 
esa es una base ortonormal. (Si no lo fuera, aplicariamos el metodo de Gram- 
Schmidt para convertirla en tal, manteniendo u 2 como primer elemento de la 
ba«° 1 Tomemos seguidamente un x cualquiera en S- 1 - y escribamos 

x = Xitq + x 2 v 2 + • • ' + x n v n . 

Entonces Xi = (x, u t ) = 0 ya que la base es ortonormal, asf que x pertenece al 
espacio engendrado por v 2 ,,v n ■ Luego dimS- 1 - = n — 1 . 

Demostremos a continuacion que T aplica en si mismo. Supongamos que 
T es hermitiana. Si x e S- 1 - tenemos 


(T(x), Wj) = (x, T(uJ) = (x, AjwO = Ai(x, u 1 ) = 0. 


por lo que T(x) e S x . Puesto que T es hermitiana en S 1 podemos aplicar la hi¬ 
potesis de induccion encontrando que T tiene n — 1 autovectores u 2 ,... ,u„ que 
constituyen una base ortonormal para S4 . Por lo tanto, el conjunto ortogonal 
u lt ... ,Un es una base ortonormal para V. Esto demuestra el teorema si T es 
hermitiana. Argumento similar aplicaremos si T es hemi-hermitiana. 

5.7 Representacion matricial para operadores hermitianos y hemi-hermitianos 

Suponemos en esta seccion que V es un espacio euclideo de dimension fini- 
ta. Una transformation hermitiana o hemi-hermitiana puede caracterizarse por 
su action sobre los elementos de una base cualquiera. 

teorema 5.5. Sean (e t .... ,e„) una base para V y T: V -> V una trans- 
formacidn lineal. Tenemos entonces: 

a) T es hermitiana si y solo si {J{ej), ei) — (e,-, T(e,)) para todo par i, j. 

b) T es hemi-hermitiana si y solo si U(ej),ei) = — (e„ T{ei))para todo par i, j. 

Demostracion. Tomemos dos elementos cualesquiera x e y de V y expre 
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semos cada uno en funcion de los elementos de la base, sean x = 2 x .j e i e 
y = 2 y&i • Tenemos entonces 


(T(*),y)= =ix j (T(e i ),fy i e,) =| J x^(T(e # ), *,). 

V=1 / 3=1 \ 1=1 / 3=11=1 


Del mismo modo encontramos 


w n 


(x, T(y)) =22 x 3 y<(e 3 , Tfo)). 

3=1 i=l 


Las proposiciones a) y b) se deducen al momento a partir de esas ecuaciones. 

Vamos a expresar estos conceptos por medio de la representation matricial 
de T. 

teorema 5.6. Sea (e x ,... ,e„) una base ortonormal para V, y sea A — (a i3 ) 
la representacion matricial de una transformacion lineal T: V -> V respecto de esa 
base. Tenemos entonces: 

a) T es hermitiana si y solo si a tj = a 3i para todo par i, j. 

b) T es hemi-hermitiana si y solo si a i} = —d 3 ,- para todo par i, /'. 
Demostracion. Puesto que A es la matriz de T tenemos T(ej) = 2Li a kfi k . 

Tomando el producto interior de T{ej) por ei y teniendo en cuenta la linealidad 
del producto interior obtenemos 

( n \ ” 

2 a *3 e *> eA = 2 a ki(e k , e .). 

»=i / a=i 

Pero (e*, £,) = 0 salvo si k = i, asf que la ultima suma se reduce a 
Qii(ei, o.) = an ya que (e;, e ; ) = 1 . Luego resulta 


a i} = (T(e,), e t ) para todo par i, j. 

Intercambiando i y /', tomando los conjugados, y teniendo en cuenta la simetria 
hermitiana del producto interior, encontramos 

da = (e,, r( e< )) para todo par i, j. 

Para completar- la demostracion basta aplicar ahora el teorema 5.5. 

5.8 Matrices hermitianas y hemi-hermitianas. Matriz adjunta de una matriz 

El teorema 5,6 nos sugiere la siguiente definition. 
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definici6n. Una matriz cuadrada A = (ay) se denomina hermitiana si 
% = an para todo par i, j. Se dice que A es hemi-hermitiana si a u = — d Jt para 
todo par i,j. 

El teorema 5.6 establece que una transformacidn T en un espacio V de di¬ 
mension finita es hermitiana o hemi-hermitiana segun que su matriz relativa a 
una base ortonormal sea hermitiana o hemi-hermitiana. 

Esas matrices pueden introducirse de otra manera. Llamemos A la matriz 
obtenida reemplazando cada elemento de A por su complejo conjugado. La ma¬ 
triz A se llama la conjugada de A. La matriz A es hermitiana si y solo si es 
igual a la transpuesta de su conjugada A — A*. Es hemi-hermitiana si A = —A‘. 
La transpuesta de la conjugada recibe un nombre especial. 

DEFINICldN DE MATRIZ ADJUNTA DE UNA MATRIZ DADA. Dada Una matriz 
cualquiera A, la transpuesta de la conjugada, A*, se llama tambien adjunta de A 
y se representa por A*. 

Asi pues, una matriz cuadrada A es hermitiana si A = A*, y hemi-hermi¬ 
tiana si A — — A*. Una matriz hermitiana se llama tambien auto-adjunta. 

Observacidn: Gran parte de la antigua literatura relativa a matrices utiliza la denomi- 
nacidn de adjunta para la transpuesta de la matriz cofactor, que es un ente completar 
mente distinto. La definicion dada aquf esta de acuerdo con la nomenclatura actual de 
la teoria de operadores lineales. 


5.9 Diagonalizacion de una matriz hermitiana o hemi-hermitiana 

teorema 5.7. Toda matriz A, nXn, hermitiana o hemi-hermitiana es se- 
mejante a la matriz diagonal A = diag (Aj,..., de sus autovalores. Ademas, 
tenemos 


A = C-L4C, 

en donde C es una matriz no singular cuya inversa es su adjunta, C~ 1 = C*. 

Demostracidn. Sea V el espacio de las n-plas de numeros complejos, y 
sea (e x ,..., e n ) la base ortonormal de vectores coordenados unitarios. Si 
x =2 x&i e y = ^ ytet, consideremos el producto interior dado por (x, y) = 
= ^ xAi ■ P ara matriz dada A, sea T la transformacidn representada por A 
relativa a la base elegida. Entonces el teorema 5.4 nos dice que V tiene una base 
ortonormal de autovectores (u x ,..., Un), respecto a la cual T tiene una repre- 
sentacion en matriz diagonal A = diag (A,.A„), siendo- A* el autovalor per- 
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teneciente a u k . Puesto que tanto A como A representan T, seran semejantes, asi 
que tenemos A = C _1 AC, donde C = (c i; ) es la matriz no singular que relaciona 
las dos bases: 


[ M 1 > • • • j W n ] — [< -i , • • • » • 

Esta ecuacion muestra que la columna / de C consta de los componentes de 
Uj respecto a (e, ,..., e„). Por consiguiente, ca es el componente i-esimo de us. 
El producto interior de «/ y iu viene dado por 

n 

(u jt Ut) =2 C kj c ki . 

k =1 

Puesto que ,u n } es un conjunto ortonormal, eso demuestra que CC* — I, 

con lo que C -1 = C* . 

Observation: La demostracion del teorema 5.7 nos dice tambien la manera de deter- 
minar la matriz diagonalizante C. Encontramos un conjunto ortonormal de autovectores 
u,,,u„ y luego utilizamos los componentes de u, (relativos a la base de vectores 
coordenados unitarios) como elementos de la columna / de C. 


EJEMPLO 1. 


La matriz real hermitiana A = 


'2 

2 


2 ' 
5 


tiene los autovalores 


Aj = l y Aj = 6. Los autovectores pertenecientes a 1 son t(2, —1), t ¥= 0. Los 
pertenecientes a 6 son_?(l,2), 0. Los dos autovectores u 1 = t( 2,-1) y 

u — f(l,2) con t — \j\j5 constituyen un conjunto ortonormal.Por consiguiente, 
la matriz 

2 1 
-1 2 . 



es una matriz diagonalizante para A. En este caso C*f= C* puesto que C es real. 


[1 

Facilmente se comprueba que C‘AC — 


O' 

6 


ejemplo 2. Si A es ya una matriz diagonal, la matriz diagonalizante C del 
teorema 5.7 o bien deja invariable A o tan solo reordena los elementos diagonales. 

5.10 Matrices unitarias. Matrices ortogonales 

definici6n. Una matriz cuadrada A se llama unitaria si A A* = I. Se 
llama ortogonal si A A* = I. 
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Observacidn: Toda matriz unitaria real es ortogonal puesto que A* = A‘. 

El teorema 5.7 nos dice que una matriz hermitiana o hemi-hermitiana siem- 
pre puede ser diagonalizada por medio de una matriz unitaria. Una matriz real 
hermitiana tiene autovalores reales y los autovectores correspondientes pueden 
tomarse reales. Por consiguiente, una matriz real hermitiana puede ser diagona¬ 
lizada por una matriz real ortogonal. Esto no es cierto para las matrices hemi- 
hermitianas reales. (Ver el ejercicio 11 de la seccidn 5.11.) 

Asimismo tenemos los conceptos relacionados siguientes, 

definici6n. Una matriz cuadrada A con elementos reales o complejos se 
llama simetrica si A — A u , se llama hemi-simetrica si A = —A*. 

ejemplo 3. Si A es real, su adjunta es igual a su transpuesta, A* — A*. 
Asf pues, toda matriz hermitiana real es simetrica, pero una matriz simetrica no 
es necesariamente hermitiana. 



1 + i 

2" 


"1 - i 2 

EJEMPLO 4. Si A = 


, entonces A = 


_3 - i 

4i_ 


3 4 / —4/_ 


A* = 


'1 4 i 
2 



y A* 


1 -i 3 + f 
2 -4/ 


[1 1 

ejemplo 5. Las dos matrices 

2 3. 

La primera es simetrica, la segunda no. 

ejemplo 6. Las dos matrices 
La primera es hemi-simetrica, la segunda no. 


' 1 
2 - i 


2 4 ■ i 
3 


son hermitianas. 


r° 

- 2 1 


A -2' 

i— 
to 

o 

I_ 

y 

2 3 i _ 


son hemi-hermitianas. 


ejemplo 7. Todos los elementos diagonales de una matriz hermitiana son 
reales. Todos los elementos diagonales de una matriz hemi-hermitiana son ima- 
ginarios puros. Todos los elementos diagonales de una matriz hemi-simetrica son 
cero. 


ejemplo 8. Para una matriz cualquiera A, la matriz B = + A*) es 

hermitiana, y la matriz C = \(A — A*) es hemi-hermitiana. Su suma es A. Asi 
pues, toda matriz cuadrada A puede expresarse como una suma A = B + C, sien- 
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do B hermitiana y C hemi-hermitiana. Es un ejercicio sencillo comprobar que 
esa descomposicion es unica. Asimismo toda matriz cuadrada A puede expre- 
sarse de manera unica como suma de una matriz simetrica, l(A A A 1 ), y una 
matriz hemi-simetrica, \{A — A 1 ). 

ejemplo 9. Si A es ortogonal tenemos 1 = det (AAO = (det A)(det A 1 ) = 
= (det A) 2 , asi que det A = ± 1. 

5.11 Ejercicios 


1. Determinar cuales de las siguientes matrices son simetricas, hemi-simetricas, hermitianas 
o hemi-hermitianas. 




"o 

1 2 




0 

‘ 2 1 


a) 

1 

0 3 

> 

b) 


i 0 3 

, 



2 

3 4 _ 



_ 

-2 

-3 4/j 



' 0 

i 

2 



' 0 

1 

2 

c) 

- 

-i 

0 

3 

d) 

-1 

0 

3 



-2 

-3 

0 _ 



-2 

-3 

0 _ 


2. a) 


Comprobar que la matriz 2x2 A = 


"cos 0 
sen 0 


— sen0' 
cos 0 


es una matriz ortogonal. 


b) Sea T la transformacidn lineal con la matriz anterior A relativa a la base ordinaria 
{/,/}. Demostrar que T aplica cada punto del piano de coordenadas polares ( r, a ) en el 
punto (r, a + 9). Asi pues, T es una rotacidn del piano alrededor del origen, siendo 
e el angulo de giro. 

3. Sea V el espacio real de dimension 3 con la base i, j, k. Demostrar que cada una 
de las matrices siguientes es ortogonal y representa la transformacion que se indica. 


a) 


b) 


1 0 0 

0 1 0 

0 0 -1 
1 0 0 " 

0-1 0 
0 0-1 


(simetria en el piano x,y). 


(simetria respecto al eje x). 
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"-1 

0 

o' 


c) 

0 

-1 

0 



0 

0 

-1 



r> 

0 

0 

1 

d) 

0 cos 6 

—sen 0 


0 sen 0 

cos 0 


‘-1 

0 

0 

e) 

0 

cos 0 

— sen 


0 

sen 0 

cos 0 


(simetrfa respecto al drigen). 


(rotaci<5n alrededor del eje x). 


(rotacidn alrededor del eje * seguida de 
simetrfa respecto al piano yz). 


4. Una matriz ortogonal real A se llama propia si det A = 1, e impropia si de/ A = —l 

TcosS — sen(f] 

a) Si A es una matriz propia 2x2, demostrar que A = 


sen 0 cos 0 


para un cierto 


0. fista representa una rotacidn de dngulo 8 


b) Demostrar que 


1 0 
0 -1 


-1 0 

0 1 


son matrices impropias. La primera representa 


una simetrfa en el piano xy respecto al eje x; la segunda representa una simetria respecto 
al eje y. Hallar todas las matrices impropias 2 x2. 

En cada uno de los ejercicios del 5 al 8, hallar a) un conjunto ortogonal de autovectores 
para A, y b) una matriz unitaria C tal que C 'AC sea una matriz diagonal. 


5. A = 


1. A — 


' 9 12' 

12 16 _ ' 

'1 3 O' 

3 -2 -1 
0 -1 1 


6. A = 


8. A = 


'0 - 2 * 

2 0 _ ' 
‘l 3 4 

3 1 0 

4 0 1 


9. Determinar cuales de las siguientes matrices son unitarias, y cuales son ortogonales 
(a,b,8 reales). 



V° O' 


cos 0 

0 

sen 0 


~i V 2 



a) 

0 e ib 

b) 

0 

1 

0 

, c) 

0 






—sen0 

0 

cos 0 


J V 2 

i^3 

-i V 6. 



156 


Autovalores de operadores en espacios euclideos 


10. La teoria especial de la relatividad hace uso de las ecuaciones 


a(x - vt), y' = y, z'=z, t' = a(t -vx/c 2 ). 


Aqui v es la velocidad de un objeto movil, c la velocidad de la luz, y a = c/ V — v 2 . 
La transformacion lineal que aplica (x, y, z, t) en (x , y', z , t') se llama transformacidn 
de Lorentz. a) Pongamos (*i, x 2 , x 3 , x t ) = ( x, y, z, ict)y(x[,x' 2 ,x’ 3$ x' t ) =(x', y', z’, ict'), 
Demostrar que las cuatro ecuaciones pueden ponerse en forma de una ecuacion matn- 
cial como sigue, 


, X 2 , X 3 , X^\ — [Xj , X2 , X 3 , ^4] 


a 
0 
0 

\_iavjc 


0 0 
1 0 
0 1 
0 0 


—iav/c 

0 

0 

a 


b) Demostrar que la matriz 4x4 de a) es ortogonal pero no unitaria. 


11. Sean a un numero real no nulo y A la matriz hemi-simetrica A = 


0 a 
—a 0 


a) Hallar un conjunto ortonormal de autovectores para A. 

b) Hallar una matriz unitaria C tal que C~‘AC sea una matriz diagonal. 

c) Demostrar que no existe una matriz ortogonal real C tal que C~'AC sea una matriz 
diagonal. 

12. Si los autovalores de una matriz hermitiana o hemi-hermitiana A son todos iguales a c, 
demostrar que A = cl. 

13. Si A es una matriz hemi-simdtrica real, demostrar que las dos matrices I — A s I + A 
son no singulares y que (I — A)(/ + A)' 1 es ortogonal. 

14. Para cada una de las siguientes proposiciones relativas a las matrices nxn, dar una 
demostracidn o un contraejemplo. 

a) Si A y B son unitarias, entonces A + B es unitaria. 

b) Si A y B son unitarias, AB es unitaria. 

c) Si A y AB son unitarias, B es unitaria. 

d) Si A y B son unitarias, A + B no es unitaria. 


5.12 Formas cuadraticas 

Sean V un espacio euclideo real y T: V V un operador simetrico. Esto 
significa que T puede cambiarse de un factor al otro en un producto interior 

(T(x),y) = (x, T(y)) 

para todo par x,y de V. 

Dada T, definamos una funcion de valores reales Q en V mediante la ecuacion 

Q(x) = (T(x), x). 
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La funcion Q se denomina forma cuadratica asociada a T. La palabra «cuadra- 
tica» esta sugerida por el teorema siguiente que muestra que en el caso de 
dimension finita Q(x) es un polinomio cuadratico en los componentes de x. 

teorema 5.8. Sea (e 1 ,..., e„) una base ortonormal para un espacio eucli- 
deo V. Sean T: V -» V una transformacion simetrica y A = (a,,) la matriz de T 
relativa a esa base. Entonces la forma cuadratica Q{x) = (T(x), x) esta ligada 
a A del modo siguiente: 

n n n 

(5.7) = si x ~ H x i e i- 

t'=l 3=1 *=1 

Demostracion. En virtud de la linealidad tenemos T(x) = 2 x f T(ef). Por 
consiguiente, 

Q(x) = (f XiT{ef), 2,x,e\= 2 J,x i x j (T(e i ), ef). 

\<=i i- i / «-i /-i 

Esto demuestra (5.7) ya que an = da = (T(ed,ef ). 

La suma que aparece en (5.7) tiene sentido incluso si la matriz A no es si¬ 
metrica. 

definici6n. Sea V un espacio euclideo real cualquiera con una base orto¬ 
normal («!,... ,e„), y sea A = (n i; ) cualquier matriz nXn de escalares. La fun- 
cion de valores escalares Q definida en cada elemento x = 2 de V por la 
suma doble 

n n 

(5.8) Q(x) = 2 J,a ii x i x j 

i=l 3=1 


se denomina la forma cuadratica asociada a A. 

Si A es una matriz diagonal, entonces an = 0 si i ¥= j de modo que la suma 

(5.8) contiene unicamente cuadrados y se puede poner en la forma mas sencilla 

(5.9) Q(x) = 2 a i{ x?. 

i =1 

En este caso la forma cuadratica se llama forma diagonal. 

La suma doble que aparece en (5.8) tambien se puede expresar como un 
producto de tres matrices. 
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teorema 5.9. Sea X = [x r ,. .. ,x„] una matrix fila 1 Xn, y sea A = (a j} ) 
una matrix nXn. Entonces XAX t es una matrix 1 X 1 cuyo elemento es 

n n 

2 2 aijXiX, ■ 

i =1 3=1 

Demostracidn. El producto XA es una matriz 1X«, XA = [yi,... ,y*]. 
en donde el elemento y,- es el producto escalar de X por la columna / de A, 

n 

y, = 2 *<««• 

i =1 

Por consiguiente, el producto XAX‘ es una matriz 1X1 cuyo unico elemento es 
el producto escalar 

n n / n \ n n 

2y, x i =212 *<««)** = 2 2w/’ 

t=l i-1 \<=1 / i=l J-l 

Observacidn: Es .corriente identificar la matriz, lxl, XAX‘ con la suma (5.9) y 
llamar al producto XAX‘ forma cuadratica. La ecuacidn (5.8) se escribe mas sencilla- 
mente as(: 


Q(x) = XAX*. 


EJEMPLO 1. 


Sean A = 




, X = [x,, x 2 ]. Tenemos entonces 


XA = 


[Xi,X z ] 


1 

-3 



= [x x — 3x 2) — + 5 x 2 ], 


y por tanto 


XAX* = 


[Xi — 3 x 2 , —x x + 5 x 2 ] 


Xi 

Lx 2 . 


= x\ — 3x 2 x x — X!X 2 + 5xl . 


ejemplo 2. Sean B = 


' 1 - 2 ' 
-2 5 


XBX* = [x lf x 2 ] 

1 

-2 

V 


.-2 

5. 

-X 2 _ 


, X = [xj, x 2 ], Tenemos entonces 


= x\ — 2x 2 X! — 2x x x 2 + 5x| 


En ambos ejemplos 1 y 2, los terminos en los productos mixtos dan al su- 
marlos 1 4x^x 2 asf que XAX* = XBX*. Estos ejemplos ponen de manifiesto que 
matrices distintas pueden conducir a la misma forma cuadratica. Observese que 
una de esas matrices es simetrica. Esto constituye un ejemplo del siguiente 
teorema. 
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teorema 5.10. Para cualquier matriz A, nXn, y cualquier matriz fila X, 
1 Xn, tenemos XAX* —XBX* en donde B es la matriz simetrica B = $(A + A 1 ). 

Demostracidn. Puesto que XAX* es una matriz lxl, es igual a su trans- 
puesta, XAX* = (XAX*)*. Pero la transpuesta de un producto es el producto de 
las transpuestas en orden mverso, por lo que (XAX 1 )* = XA*X*. Por consiguien- 
te XAX* = | XAX* + i XA*X* = XBX*. 

5.13 Reduccion de una fonna cuadratica real a forma diagonal 

Una matriz simetrica real A es hermitiana. Por tanto, segun el teorema 5.7 
es semejante a la matriz diagonal A = diag (A,!,. .., A n ), de sus autovalores. 
Ademas, tenemos A = C*AC, siendo C una matriz ortogonal. Vamos ahora a 
demostrar que C puede utilizarse para convertir la forma cuadratica XAX* a una 
forma diagonal. 

teorema 5.11. Sea XAX* una forma cuadratica asociada a una matriz si¬ 
metrica real A, y sea C una matriz ortogonal que convierte A en una matriz dia¬ 
gonal A = C*AC . Tenemos entonces 

XAX*=YAY* = i^yl 

i=l 

donde Y = [y x ,... ,y n ] es la matriz fila Y = XC, y K ,,K son los auto¬ 
valores de A. 

Demostracidn. Puesto que C es ortogonal tenemos C _l = C*. Por consi- 
guiente la ecuacion Y = XC implica X — YC*, y obtenemos 

XAX* = ( YC*)A(YC*)* = Y(C*AC)Y* = YAY*. 

Observacidn: El teorema 5.11 se expresa diciendo que la transformacion lineal 
Y = XC reduce la forma cuadratica XAX‘ a una forma diagonal YAY'. 

ejemplo 1. La forma cuadratica correspondiente a la matriz identidad es 

XIX* = Zx*=\\X\\\ 

1=1 

que es el cuadrado de la longitud del vector X = (x x ,..., x„). Una transforma- 
cion lineal Y = XC, donde C es una matriz ortogonal, nos da una nueva forma 
cuadratica YAY* siendo A = C/C* = CC* = /. Puesto que XIX* = Y1Y* tene¬ 
mos 11A|[ 2 =||F|| 2 , por lo que Y tiene la misma longitud que X. Una transfor¬ 
macion lineal que conserva la longitud de cada vector se denomina isometria. 



160 


Autovalores de operadores en espacios euclldeos, 


En la section 5.19 se estudian con mayor detalle esas transformaciones. 


ejemplo 2. Determinar una matriz ortogonal C que reduzca la forma cua- 
dratica Q(x) = 2x\ + 4x 2 x 2 + 5xJ a forma diagonal. 


Solution. 


Escribamos Q{x) = XAX*, siendo A = 


'2 2 ' 
2 5 


. Esta matriz si- 


metrica se diagonalizo en el ejemplo 1 que sigue al teorema 5.7. Tiene los auto¬ 
valores K = 1 , A 2 = 6, y un conjunto ortonormal de autovectores u lt « 2 , siendo 
= t(2, —1), u 2 = t(l, 2), t — l/V5. Una matriz diagonalizante ortogonal es 


C = 



1 

2 


. La forma diagonal correspondiente es 


LAY* = X x y\ + X t y\ = y* + 6 y*. 


El resultado del ejemplo 2 tiene una interpretation geometrica sencilla, re- 
presentada en la figura 5.1. La transformation lineal Y — XC puede considerarse 
como una rotacion que aplica la base /, j en la nueva base u lt u 2 . Un punto 
que respecto a la primera base tiene coordenadas (Xj, x 2 ). tiene las nuevas coorde- 
xladas (y lt y 2 ) respecto a la segunda base. Puesto que XAX* = YAY*, el conjunto 
de puntos (x lt x 2 ) que satisfacen la ecuacion XAX* = c para un cierto c es iden- 
tico al conjunto de puntos (y^ y 2 ) que satisfacen YAY* = c. La segunda ecuacion, 
escrita en la forma y\ + 6y| = c, es la ecuacion cartesiana de una elipse si 
c>0. Por tanto la ecuacion XAX 1 =c, puesta en la forma 2x\ + 4xix 2 + 5x'i = c, 
representa la misma elipse en el sistema coordenado original. La figura 5.1 
muestra la elipse correspondiente a c = 9. 



la base i,j 
la base u*, u 2 


Figura 5.1 Rotacidn de ejes mediante una matriz ortogonal. La elipse tiene la ecuacidn 
cartesiana XAX' = 9 en el sistema x,x 2 , y la ecuacidn YAY‘ = 9 en el sistema y,y 2 . 
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5.14 Aplicaciones a la Geometria Analitica 

La reducci6n de una forma cuadratica a forma diagonal puede utilizarse 
para identificar el conjunto de todos los puntos (x, y) del piano que satisface una 
ecuaci6n cartesiana de la forma 

(5.10) ax * + bxy + cy a + dx + ey +f= 0. 

Encontraremos siempre que ese conjunto es una seccion c6nica, esto es, una elipse, 
una hiperbola, una parabola o uno de los casos degenerados (el conjunto vacio, 
un solo pun to, o una o dos rectas). El tipo de cdnica viene caracterizado por los 
terminos de segundo grado, esto es, por la forma cuadratica ax 2 + bxy + cy 2 . 
Tengase en cuenta que aqui hemos puesto x en lugar de x t e y en lugar de x 2 . 
Volviendo a la notacidn anterior y expresando esa forma cuadratica como pro- 
ducto matricial 


XAX‘ = ax f + bx r Xi + cx\. 


siendo X = [*„ x 2 ] y A = 


' a b/2~ 
bjl c _ 


Con la rotacion Y = XC reducimos esa 


forma cuadratica a una forma diagonal \y a + donde Aj, Aj son los autova- 
lores de A. Un conjunto ortonormal de autovectores Ui,u 2 determina un nuevo 
conjunto de ejes coordenados, respecto a los cuales la ecuacidn cartesiana (5.10) 
se convierte en 


(5.11) Ajyf + hy\ + d'y x + e'y 2 + / = 0, 


con nuevos coeficientes d' y e? en los terminos de primer grado. En esta ecuacion 
no existe termino en el producto mixto y 1 y 2 , con lo cual el tipo de conica se 
identifica facilmente examinando los autovalores A x y A 2 . Si la conica no es dege- 
nerada, la ecuacion (5.11) representa una elipse si A 1; A 2 tienen el mismo signo, 
una hiperbola si A,, A 2 tienen signos contrarios, y una parabola si uno de los 
dos es cero y el otro no. Los tres casos corresponden a A X A 2 > 0, A X A 2 < 0, y 
AjA, = 0. Seguidamente damos algunos ejemplos. 

ejemplo 1. 2x 2 + 4xy + 5y 2 + 4x + 13y — J = 0 . Escribimos la ecua- 
ci6n asi 

(5.12) 2x x + 4 x x x 2 + 5$cl + 4x x + 13x 2 — £ = 0. 

La forma cuadratica 2x\ + 4x x x 2 + 5x\ es la tratada en el ejemplo 2 de la seccion 
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anterior. Su matriz tiene los autovalores A, = 1, A 2 = 6, y un conjunto ortonor- 
mal de autovectores u x — t(2, —1), u 2 = t(l, 2), siendo t = l/^/s. Una matriz 


diagonalizante ortogonal es C = t 


' 2 1 
-1 2 


. Esta reduce la parte cuadratica de 


(5.12) a la forma J 2 + 6 y\. Para determinar el efecto en la parte de primer grado 
ponemos la ecuacion de la rotacion Y = XC en la forma X = YC l y obtenemos 


[Xl,X 2 ] = —= [y^y-j] 


2 -1 

LI 2J 


*i = ^| (2^i + y »). *2 = ^ (-> ' 1 + 2y>2) ■ 

Por consiguiente, la parte lineal 4x x +13x 2 se transforma en 

(2yi + y 2 ) + —| (— y x + 2y 2 ) = — y/5 y x + 6^/5 y 2 . 


La ecuacion cartesiana transformada se convierte en 


yl + 6yjj - V 5 -Hi + 6 V 5 ^2 — i = 0 • 


Completando los cuadrados en y x e y 2 escribimos esa asf: 

Ox - W5) 2 + 6(y 2 + iV5) 2 = 9. 

Esta es la ecuacion de una elipse con su centro en el punto Q\/5, — £\/5) en el 
sistema coordenado y^. Las direcciones positivas de los ejes y x e y 2 estan deter- 
minadas por los autovectores u x y « 2 , como se indica en la figura 5.2. 

Podemos aun simplificar mas la ecuacion escribiendo 

Zi = yi - iV5, z 2 = j 2 + ■ 

Geomdtricamente, esto es lo mismo que introducir un nuevo sistema de ejes 
coordenados paralelos a los ejes y t y 2 pero con el nuevo origen en el centro de la 
elipse. En el sistema z,z 2 la ecuacion de la elipse es sencilla 

z i + 6z| = 9, o d + A = 1 ' 

9 3/2 

La elipse y los tres sistemas de coordenadas se han dibujado en la figura 5.2. 



Aplicaciones a la Geometria Analitica 


163 



Figura 5.2 Rotacidn y .traslacidn de ejes coordenados. La rotacidn Y = XC viene 
seguida por la traslacidn z x = y x - ^5, z 2 = y 2 + $\/5. 


ejemplo 2. 2x 2 — 4xy — y 2 — 4x + 10y — 13 = 0 . Pongamosla en la 
forma 


2xi 4x^x 2 — x| — 4xi -f- 10x2 — 13 — 0. 

f 2 -T 

La parte cuadratica es XAX 1 , siendo A = . Esta matriz tiene los auto- 

—2 - 1 _ 

valores A., = 3, \ 2 =—2. Un conjunto ortonormal de autovectores es u, = t(2, —1), 
«2 = t( 1,2), siendo t = j . Una matriz diagonalizante ortogonal es 

" 2 n 

C = t .La ecuacion de la rotacion X = YC‘ nos da 

_-l 2] 

x i - (2^1 + y*) - ( -J’i + 2 y 2 ). 


Por consiguiente, la ecuacidn transformada se convierte en 

3yl — 2y\ ~(2yj + y 2 ) H— y= (—Yi + 2y 2 ) — 13 = 0, 




o 
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(a) Hiperbola: 3 z\- 2z\ = 12 (b) Parabola: y\ + y t = 0 


Figura 5.3 Curvas de los ejemplos 2 y 3. 

Completando los cuadrados en y 1 e y 2 obtenemos la ecuacion 

30i - 1 V 5) 2 - 20 >, - h/sy = 12, 

que representa una hiperbola con centro en (|V5, fV5) en el slstema y jy 2 . La tras- 
lacion z x = y x — $^5, z 2 = _y a — |^/5 simplifica la ecuacion llegando a 

3z* — 2zg = 12, o ^-^=1. 

4 6 

La hiperbola esta dibujada en la figura 5.3(a). Los autovectores u x y u 2 determinan 
las direcciones positivas de los ejes y x e y 2 . 

ejemplo 3. 9x 2 + 2Axy + 16y 2 — 20x + 15y =s 0 . Pongamos esta ecuacion 
asi: 
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u 2 = i(— 4, 3). Una matriz diagonalizante ortogonal es C = 
tacion X = YC‘ nos eta 
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*i = s(3jx - 4y 2 ), x 2 = i(4y x + 3_y 2 ). 

Por consiguiente, la ecuacion cartesiana transformada se convierte en 


25 y{ - - 4y 2 ) + ¥(4>' 1 + 3y 2 ) = 0. 


Simplificando esa ecuacion se llega a yl + yi = 0, que es la ecuacion de una pa¬ 
rabola con el vertice en el origen. La parabola esta dibujada en la figura 5.3(b). 


ejemplo 4. Casos degenerados. El solo conocimiento de los autovalores no 
revela si la ecuacion cartesiana representa una conica degenerada. Por ejemplo, las 
tres ecuaciones x 2 + 2y a = 1 , x 2 + 2y 2 = 0 y x 2 + 2y 2 = — 1 tienen los mismos 
autovalores; la primera representa una elipse no degenerada, la segunda sdlo se 
satisface para ( x , y) = (0,0), y la tercera representa el conjunto vacio. Las dos 
ultimas pueden considerarse casos degenerados de elipse. 

La grafica de la ecuacion y 2 = 0 es el eje x. La ecuacion y 2 — 1 = 0 repre¬ 
senta las dos rectas paralelas y = 1 ey = -1. fistos pueden considerarse como 
casos degenerados de parabola. La ecuacion x 2 — 4y 2 = 0 representa dos rectas 
que se cortan ya que se satisface si x — 2y = 0 o si x + 2y = 0 . Este puede 
considerarse como caso degenerado de hiperbola. 

Sin embargo, si la ecuacion cartesiana ax 2 -f- bxy + cy 2 -f dx -f- ey + f = 0 
representa una conica no degenerada, entonces el tipo de conica puede determi¬ 
nate con. toda facilidad. El polinomio caracteristico de la matriz de la forma 
cuadratica ax 2 + bxy + cy 2 es 


det 


‘A — a 
_—b/2 


-b/2' 
A — c 


= A 2 — (a + c)A + (ac - \b 2 ) = (A - A X )(A - A 2 ). 


Por tanto, el producto de los autovalores es 


A x A 2 = ac- | b 2 = i(4 ac - b 2 ). 


Puesto que el tipo de conica esta determinado por el signo algebraico del producto 
A-iA..,, vemos que la conica es elipse, hiperbola o parabola, segun que 4 ac — b 2 sea 
positivo, negativo o nulo. El numero 4 ac — b 2 se llama discriminante de la forma 
cuadratica ax 2 + bxy + cy 2 . En los ejemplos 1, 2 y 3 el discriminante tiene los 
valores 34, —24, y 0, respectivamente. 
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5.15 Ejercicios 

En cada uno de los ejercicios 1 al 7, hallar a) una matriz sim6trica A para la forma 
cuadratica; b) los autovalores de A; c) un conjunto ortonormal de autovectores; d) una 
matriz diagonalizante ortogonal C. 


1. 4x 2 + 4x^2 + xf. 

2. x x x 2 . 

3. x\ 4- 2x r x% — x\. 

4. 34xl ~ 34x^2 + 41x 2 . 


5. jcf + x x x 2 + x x x 3 + x 2 x 3 . 

6. 2x\ + 4x^3 + x\ — xf. 

7. 3x 2 + 4 xjX 2 + 8xjX 3 + 4x 2 x 3 + 3xf. 


En cada uno de los ejercicios 8 al 18, identificar la cdnica representada por la ecuacidn 
cartesiana y hacer un dibujo. 


8. f - 2xy + 2x 2 - 5 = 0. 

9. / - 2xy + 5jc = 0. 

10. f - 2xy + x 2 - 5x = 0. 

11. 5x 2 -4 xy +2y 2 -6 =0. 

12. 19x 2 + 4x/ + 16 y 2 - 212x + 104>; = 356. 

13. 9x 2 + 24 xy + 16 y 2 - 52x + I4y = 6. 


14. 5x 2 + 6xy + 5/ - 2 = 0. 

15. x 2 + 2xy + f - 2x + 2y + 3 = 0 . 

16. 2X 2 + 4x_y + 5/ — 2x — y - 4 = 0. 

17. x 2 +4xy -2 y 2 - 12 =0. 

18. xy + y — 2x — 2 = 0. 


19. 2Para que valor (o valores) de c la grafica de la ecuacion cartesiana 2xy—4x+7y+c=0 
sera un par de rectas? 

20. Si la ecuaci6n ax 1 + bxy + cy 1 = 1 representa una elipse, demostrar que el area de la 
region que limita es 2ir/V4ac — b 2 . Est0 c * a un significado geometrico al discriminante 
4ac — b 1 . 


* 5.16 (*) Autovalores de una transformacion simetrica obtenidos eomo valores 
de su forma cuadratica 

Vamos a prescindir ahora de la exigencia de que V sea de dimension finita 
y vamos a encontrar una relacion entre los autovalores de un operador simetrico 
y su forma cuadratica. 

Supongamos que x es un autovector con norma 1 perteneciente a un autova¬ 
lor A. Entonces T(x) — Ax con lo que tenemos 

(5.13) Q ( x ) = (7(x), x) = (Ax, x) = A(x, x) = A, 

ya que (x, x) = 1. El conjunto de todos los x de V que satisfacen (x,x) = 1 se 

(*) Las secciones senaladas con asterisco pueden suprimirse o posponerse sin perjuicio 
de la continuidad del tema. 
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llama la esfera unidad de V. La ecuacion (5.13) demuestra el teorema siguiente. 


teorema 5.12. Sea T: V -*■ V una transformation simetrica en un espacio 
euclideo real V, y sea Q(x) = (T(x), x). Entonces los autovalores de T (si existe 
alguno) se encuentran entre los valores que Q toma en la esfera unidad de V. 

EJEMPLO. Sea V = V 2 (R) con la base (i,j) y con el producto escalar ordi- 
nario como producto interior. Sea T la transformation simetrica con matriz 


A = 


'4 

0 


O' 

8 


. Entonces la forma cuadratica de T viene dada por 

60) = X I a u x iXj = 4x? + 8 X 2 . 

)=1 i=l 


Los autovalores de T son Xj = 4, X 2 = 8. Es facil ver que esos autovalores son, 
respectivamente, los valores minimo y maximo que toma Q en el circulo unidad 
x\ + xl — 1 . En efecto, en ese circulo tenemos 


Q(x ) = 4(x* + x\) + 4xg = 4 + 4xa, donde — 1 <, x 2 <, 1. 

Este alcanza el valor minimo, 4, cuando x 2 — 0 y el maximo, 8, cuando x 2 = ± 1. 


La figura 5.4 muestra el circulo unidad y dos elipses. La elipse interior tiene 
como ecuacion cartesiana 4x\ + 8x| = 4. Consta de todos los puntos x = (xi,x 2 ) 
del piano que satisfacen Q(x) = 4. La elipse exterior es la de ecuacion 
4xl + 8xj = 8 y consta de los puntos que satisfacen Q(x) = 8. Los puntos 
(±1,0) en los que la elipse interior es tangente al circulo unidad son autovectores 
correspondientes al autovalor 4. Los puntos (0, ±1) de la elipse exterior son 
autovectores correspondientes al autovalor 8. 

El ejemplo anterior ilustra propiedades relativas a los extremos de los auto¬ 
valores que son validos con mayor generalidad. En la seccion que sigue probare- 
mos que el minimo y el maximo autovalor (si existen) son siempre el minimo y el 
maximo valor que Q toma en la esfera unidad. En la discusion que vamos a hacer 
de esas propiedades utilizaremos el siguiente teorema relativo a formas cuadra- 
ticas. Debe observarse que este teorema no exige que V sea de dimension finita. 

teorema 5.13. Sea T: V V una transformacidn simetrica en un espacio 
euclideo real V con forma cuadratica Q(x) = ( T(x ), x). Supongamos que Q no 
cambia de signo en V. Entonces si Q(x) = 0 para un cierto x de V tambien te 
nemos T(x) = O. Dicho de otro modo, si Q no cambia de signo, entonces Q se 
anula solamente en el nucleo de T. 


Demostracidn. Supongamos que Q(x) = 0 para un cierto x de V y sea y 
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Figura 5.4 Relation geometrica entre los autovalores de T y los valores de Q en la 
esfera unidad, ilustrada con un ejemplo bi-dimensional. 

un elemento cualquiera de V. Elijamos un t cualquiera y consideremos Q(x + ty). 
Empleando la linealidad de T, la linealidad del producto interior, y la simetria 
de T, tenemos 

Q(x + ty) = (T(x + ty), x + ty) = (T(x) + tT(y), x + ty) 

= (T(x), X ) + t(T(x),y) + t(T(y), x) + t\T(y),y) 

= Q(x) + 2 t(T(x),y) + t*Q(y) = at + bt\ 

siendo a = 2(T(x), y) y b = Q( y). Si Q es no negativa en V tenemos la des- 
igualdad 


at + bt 2 > 0 para todo numero real t. 


En otras palabras, el polinomio cuadratico p(t) = at + bt 2 tiene su minimo en 
t = 0. Luego p\ 0) = 0. Pero p'(0) = a = 2(T(x), y), asi que (T(x), y) = 0. Pues- 
to que y es arbitrario, podemos tomar en particular y = T(x), dando 
(T(x), T(x))~ 0. Esto demuestra que T(x) — O. 

Si Q es no positiva en V tenemos p(t) — at + bt 2 ^ 0 para todo t, asi que p 
tiene su maximo en t = 0, y por tanto p'(O) = 0 como antes. 

*5-17 Propiedades relativas a extremos de los autovalores de una transformacion 
simetrica 

Demostraremos ahora que los valores extremos de una forma cuadratica en la 
esfera unidad son autovalores. 

teorema 5.14. Sea T: V V una transformacidn lineal simetrica en un es- 
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pacio euclideo real V, y sea Q(x) = (Tlx), x). Entre todos los valores que Q toma 
en la esfera unidad, supongamos que existe uti extremo (*) (maximo o mlnimo) 
en un punto u en el que (u, u) — 1 . Entonces u es un autovector para T; el corres- 
pondiente autovalor es Q(u), valor extremo de Q en la esfera unidad. 

Demostracion. Supongamos que Q tiene un mi'nimo en u. Tenemos entonces 

(5.14) Q(x) > Q(u ) para todo x que cumpla (x, x) = 1. 

Sea A. = Q(u). Si (x,x) = 1 tenemos Q(u) = A(x,x) = (Ax,x) asi que la des- 
igualdad (5.14) puede ponerse asi 

(5.15) (T(x), x) > (Ax, x) 

con tal que (x, x) = 1. Demostremos ahora que (5.15) es valido para todo x de 
V. Supongamos que jjxjj = a. Entonces x = ay, siendo ||yj| = 1. Luego 


(T(x), x) = (T(ay), ay) = a\T(y), y) y (Ax, x) = a\ly, y). 

Pero (T(y),y) ^ (Ay, y) ya que (y, y) = 1. Multiplicando ambos miembros de esta 
desigualdad por a 2 llegamos a (5.15) para x = ay. 

Puesto que (T(x), x) - (Ax, x) = (T(x) - Ax, x), podemos poner la desigual¬ 
dad (5.15) en la forma (T(x) — Ax, x) ^ 0, o 

(5.16) (*5(x), x) )> 0, donde S = T — A/. 

Cuando x = u tenemos la desigualdad (5.14) y por tanto tambien (5.16). La 
transformacion lineal S es simetrica. La .desigualdad (5.16) establece que la 
forma cuadratica Qi dada por Qi(x) = (S(x), x) es no negativa en V. Cuando 
x = u tenemos Q,(x) = 0. Por consiguiente, segun el teorema 5.13 debe ser 
S(u) = O. Dicho de otro omdo, T(u) — A u, asi que u es un autovector para T, 
y A = Q(u) es el correspondiente autovalor. Esto completa la demostracion si Q 
tiene un mi'nimo en u. 

Si existe un maximo en u todas las desigualdades de la demostracion anterior 
se invierten y aplicamos el teorema 5.13 a la forma cuadratica no positiva CL. 

(*) Si V es de dimension infinita, la forma cuadratica Q no tiene necesariamente un 
extremo en la esfera unidad. Este sera el caso cuando T no tiene autovalores. En el caso 
de dimension finita, Q tiene siempre un maximo y un mi'nimo en algun punto de la esfera 
unidad. Esto resulta como una consecuencia de un teorema mas general sobre los valores 
extremos de funciones continuas. En la seccion 9.16 puede verse un caso particular de ese 
teorema. 
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* 5.18 Caso de dimension finita 

Supongamos ahora que dim V = n. Entonces T tiene n autovalores reales 
que pueden disponerse en orden creciente 

De acuerdo con el teorema 5.14, el menor autovalor A, es el minimo de Q en la es- 
fera unidad, y el mayor autovalor es el maximo de Q en la esfera unidad. Demos- 
traremos seguidamente que los autovalores intermedios tambien se presentan como 
valores extremos de Q, restringidos a ciertos subconjuntos de la esfera unidad. 

Sea u x un autovector en la esfera unidad que minimiza Q. Entonces 
Aj = Q(Wj). Si A es un autovalor distinto de X x cualquier autovector correspon- 
diente a A debe ser ortogonal a u x . Por consiguiente.es natural buscar como tal 
un autovector en el complemento ortogonal del subespacio engendrado por u x . 

Sea S el subespacio engendrado por u x . El complemento ortogonal S 1 - 
consta de todos los elementos de V ortogonal a En particular, S- 1 - contiene 
todos los autovectores correspondientes a los autovalores A ^ A,. Es facil com- 
probar que dimS-L = n — 1 y que T aplica S- 1 - en si mismo (*). Designemos 
por S„-x la esfera unidad en el subespacio S-L de dimension n — 1. (La esfera 
unidad S n -i es un subconjunto de la esfera unidad en V.) Aplicando el teorema 
5.14 al subespacio S-J- encontramos que A 2 = Q(u 2 ), donde u 2 es un punto que 
hace minimo Q en S n _ x . 

El siguiente autovector A 3 puede obtenerse en forma parecida como el valor 
minimo de Q en la esfera unidad S„_ 2 en el espacio de dimension n — 2 que 
consta de aquellos elementos ortogonales simultaneamente a u, y u 2 . Continuando 
en esta forma encontramos que cada autovalor A* es el valor minimo que toma 
Q en una esfera unidad S„_* +1 en un subespacio de dimension n — k + 1. El 
mayor de esos minimos, A„, es tambien el maximo valor que toma Q en cada una 
de las esferas S„_* +1 . El correspondiente conjunto de autovectores u x ,,u n 
forma una base ortonormal para V. 

5.19 Transformaciones unitarias 

Concluimos este capitulo con una breve discusion de otro tipo importante 
de transformaciones llamadas unitarias. En el caso de dimension finita estan 
representadas por matrices unidad. 

definicion. Sean E un espacio euclideo y V un subespacio de E. Una 
transformacion T:V E se llama unitaria en V si tenemos 

(T(x), T(y)) = (x,y) para todo par x, y de V. (5.17) 

(*) Esto se hizo en la demostracion del teorema 5.4, seccion 5.6. 
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Cuando E es un espacio euclideo real, una transformation unitaria tambien se 
denomina transformation ortogonal. 

La ecuacion (5.17) se expresa diciendo que T conserva los productos inte- 
riores. En consecuencia, es natural esperar que T tambien conserve la ortogo- 
naiidad y las normas, pues estas se derivan de los productos interiores. 

teorema 5.15. Si T: V ~* E es una transformacidn unitaria de V, enton- 
ces para todo par x,y de V tenemos 

a) (*, y) = 0 implica (Tlx), T(y)) = 0 (T conserva la ortogonalidad). 

b) ||r(x)|| = ||x|| (T conserva las normas). 

c) ||r(x) — T(y)|| = ||x — y|| (T conserva las distancias). 

d) T es invertible, y T~ x es unitaria en T(V). 

Demostracion. La parte a) es consecuencia inmediata de la ecuacion (5.17). 
La parte b) se deduce haciendo x = y en (5.17). La parte c) resulta de b) porque 
T(x) - T(y) - T(x - y). 

Para demostrar d) aplicamos b) lo que hace ver que T(x) = 0 implica x — O, 
asi que T es invertible. Si x £ T(V) eye T(V) podemos escribir * = T(u), 
y = T(v). con lo que tenemos 

(T-Hx), T~\y)) = (u, v) = ( T(u), T(v)) = (x,y). 

Por Jo tanto 7’~~‘ es unitaria en T(V). 

En cuanto a los autovalores y autovectores tenemos el teorema siguiente. 

teorema 5.16. Sea T\V~*E una transformacidn unitaria en V. 

a) Si T tiene un autovalor A, entonces |A| = 1 . 

b) Si x e y son autovectores correspondientes a autovalores distintos Ay p., 
entonces x e y son ortogonales. 

c) Si V — E y dim V = n, y si V es un espacio complejo, existen los auto¬ 
vectores u 1 ,... ,u n de T que forman una base ortonormal para V. La 
matriz de T relativa a esa base es la matriz diagonal A = diag (A,, .. . ,A n ), 
siendo A* el autovalor correspondiente a Uk. 

Demostracion. Para demostrar a), sea x un autovector correspondiente a A. 
Entonces x ¥=■ O y T(x) = Ax. Haciendo y = x en la ecuacion (5.17) llegamos a 

(Ax, Ax) = (x, x) o AA(x, x) = (x, x). 

Puesto que (x, x) > 0 y AA = |A| 2 , esto implica |A| = 1 . 
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Para demostrar b), escribamos T(x) = Ax, T(y) = ny y calcularemos el pro- 
ducto interior ( T(x ), T(y)) de dos maneras. Tenemos 

T(y )) = (x,j) 

ya que T es unitaria. Asimismo 

(T(x), T(y)) = (ax, py) = X/l(x,y) 

ya que x e y son autovectores. Por consiguiente Xfi(x, y) = (x, y), asi que (x, y) = 0 
salvo si A/7 = 1. Pero XX = 1 segun a), por lo que si fuera Xfl. = 1 deberia ser 
XX — XfL,X = fi,X = p , lo que contradice la hipotesis de que A y /x son dis- 
tintos. Por consiguiente Xfi 1 y (x, y) = 0. 

El apartado c) se demuestra por induccion respecto de n en forma muy pare- 
cida al teorema 5.4, que da el resultado analogo para los operadores hermitianos. 
El unico cambio necesario afecta a la parte de la demostracion que afirma que T 
aplica S-J- en si mismo, donde 

S' 1 = {x | x e V, (x, i/j) = 0}. 

Aqui u, es un autovector de T con el autovalor A x . A partir de la ecuacion 
T(Ut) — AjUj encontramos 


Ul = Ar x T( Ul ) = x.nu,) 

ya que Xj^ = (Ad 2 = 1 • Elijamos ahora un x cualquiera en S- 1 y observemos que 

. (7-(x), u x ) = (T(x), X x T(u x )) = X(T(x), T(u x )) = ^(x, u x ) = 0. 

Luego T(x) e S 1 si x £ S 1 , por lo cual T aplica S- 1 en si mismo. El resto de 
la demostracion es identico a la del teorema 5.4, por lo que no lo repetiremos. 

Los dos teoremas que siguen se refieren a propiedades de las transformaciones 
unitarias en espacios de dimension finita. Damos tan solo un bosquejo de las 
demostraciones. 

teorema 5.17. Supongamos que dim V — n y sea E = (e x ,... ,e„) una 
base para V fijada. La transformation lineal T: V V es unitaria si y solo si 


( 5 . 18 ) 


(J(ed, T ( e i)) — ( e i> *1) para todo par i, j. 
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En particular, si E es ortonormal entonces T es unitaria si y solo si T aplica E en 
una base ortonormal. 

Esbozo de la demostracion. Pongamos x = xie it y = _£ y,-e,-. Tenemos en¬ 
tonces 


( n n \ n n 

2 X&, 2 y> e i ) = 2 y Lx i y i (e i ,e j ), 

i= 1 1 / 1=1 3=1 

(T(x), T{y )) = = 2 T^)). 

\t=l 1= l / *=1 i=l 


A continuation se compara (x, y) con (T(x), T(y)). 

teorema 5.18. Supongamos que dim V = n y sea (<?, wna feast 

ortonormal para V. Sea A = (a i; ) la representacion matricial de una transformacion 
lineal T: V -» V relativa a esa base. Entonces T es unitaria si y solo si A es uni¬ 
taria, esto es, si y solo si 

(5.19) a* A = I. 

Esbozo de la demostracion. Puesto que {e t , e,) es el elemento ij de la matriz 
identidad, la ecuacion (5.19) implica 

n n 

(5.20) {e i , Cj) = 2 d ki a kj = 2 a kl d kj . 

fc=i it=i 

Puesto que A es la matriz de T tenemos T (<?,) = a id e k > ^( e 3 ) = 2”_=i a « e r con 
lo cual 


(T(e,), T(e,)) = ( 2 2 a rj e r \ =2 2 

U=1 r=l / *=1 r=l 


( e k ) e r) — 2 a kidjcj ■ 
*= 1 


Se compara luego con (5.20) y se aplica el teorema 5.17. 

teorema 5.19. Toda matriz unitaria A tiene las propiedades siguientes: 

a) A es no singular y A -1 = A*. 

b) Cada una de las matrices A\ A y A* es unitaria. 

c) Los autovalores de A son numeros complejos de valor absoluto 1. 

d) jdet A\ = 1 ; si A es real, entonces det A = ±1. 

La demostrackin del teorema 5.19 se deja como ejercicio para el lector. 
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5.20 Ejercicios 

1. a) Sea T-.V —» V la transformation dada por T(x) = cx, donde c es un escalar fijado. 
Demostrar que T es unitaria si y solo si |c| = 1 . 

b) Si V es unidimensional, demostrar que las unicas transformaciones unitarias en V 
son las descritas en a). En particular, si V es un espacio real unidimensional, existen 
s<51o dos transformaciones ortogonales, T(x) — x y T(x) — —x. 

2. Demostrar cada una de las proposiciones relativas a una matriz A, nxn, real orto- 
gonal 

a) Si X es un autovalor real de A, entonces X = 1 6X=— 1. 

b) Si X es un autovalor complejo de A, el complejo conjugado A tambien es autovalor 
de A . Es decir, los autovalores de A no reales son conjugados a pares. 

c) Si n es impar, A tiene por lo menos un autovalor real. 

3. Sea V un espacio euclfdeo real de dimension n. Una transformation ortogonal T: V —> V 
con determinante igual a 1 se llama rotation. Si n es impar, demostrar que 1 es auto¬ 
valor para T. Esto prueba que toda rotation de un espacio de dimensidn impar tiene 
un eje fijo. [Indication: Aplicar el ejercicio 2.] 

4. Dada una matriz real ortogonal A con — 1 como autovalor de multiplicidad k. Demostrar 
que det A = ( — l) fc . 

5. Si T es lineal y conserva la norma, demostrar que T es unitaria. 

6. Si T: V —> V es unitaria y hermitiana, demostrar que T 2 = / . 

7. Sean e„) y («,,..., u„) dos bases ortonormales para un espacio euclideo V. 

Demostrar que existe una transformation unitaria T que aplica una de esas bases en 
la otra. 

8. Hallar un numero real a tal que la siguiente matriz sea unitaria: 

' a \i \a(2i - 1)' 

ia |(1 + 0 ia(l - /) . 

a -j \a{2 - i) 

9. Si A es una matriz hemi-hermitiana, demostrar que I — A e I + A son no singulares 
y que (/ — A)(I + A)~ 1 es unitaria. 

10. Si A es una matriz unitaria y si / + A es no singular, demostrar que (/ — A)(I + A )~ 1 
es hemi-hermitiana. 

11. Si A es hermitiana, demostrar que A — il es no singular y que (A — iI)~\A + t7) es 
unitaria. 

12. Demostrar que cualquier matriz unitaria puede diagonalizarse con una matriz unitaria. 

13. Una matriz cuadrada se llama normal si AA* = A*A . Determinar cual de los tipos 
siguientes de matrices son normales. 

a) Matrices hermitianas. d) Matrices hemi-simetricas. 

b) Matrices hemi-hermitianas. e) Matrices unitarias. 

c) Matrices simetricas. f) Matrices ortogonales. 

14. Si A es una matriz normal (AA* = A*A) y si U es una matriz unitaria, demostrar que 

U*AU es normal. 
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6.1 Introduccion historica 

La historia de las ecuaciones diferenciales comenzo en el siglo xvn cuando 
Newton, Leibniz y los Bernoulli resolvieron algunas ecuaciones diferenciales sen- 
cillas de primero y segundo orden que se presentaron en problemas de Geometria 
y Mecanica. Estos primeros descubrimientos, iniciados alrededor de 1690, hicieron 
creer que las soluciones de todas las ecuaciones diferenciales originadas en pro¬ 
blemas geometricos y fisicos podrian expresarse por medio de las funciones ele- 
mentales del Calculo. Por ello, gran parte de los primeros esfuerzos fueron 
orientados al desarrollo de tecnicas ingeniosas para resolver ecuaciones diferen¬ 
ciales por medio de recursos sencillos, como son la adicion, sustraccion, multipli¬ 
cation, division, composicion e integration, aplicadas tan solo un numero finito 
de veces a las funciones ordinarias del Calculo. 

Los metodos especiales, tales como la separation de variables y el empleo de 
factores integrantes,fueron ideados de manera mas o menos casual antes de fines 
del siglo xvn. Durante el siglo xvm, fueron desarrollados procedimientos mas 
sistematicos, principalmente por Euler, Lagrange y Laplace. Pronto se vio que 
relativamente pocas ecuaciones diferenciales podian resolverse con recursos ele- 
mentales. Poco a poco, los matematicos fueron dandose cuenta que era vano 
empeno el intentar descubrir metodos para resolver todas las ecuaciones diferen¬ 
ciales. En lugar de ello, encontraron mas provechoso averiguar si una ecuacion 
diferencial dada, tenia o no solucion y, cuando la tenia, intentar la deduction de 
propiedades de la solucion a partir de la misma ecuacion diferencial. Con ello, 
los matematicos empezaron a considerar las ecuaciones diferenciales como fuentes 
de nuevas funciones. 

A principios del siglo xix se desarrollo una fase importante de esa teoria, 
siguiendo una tendencia paralela a la de conseguir un desarrollo mas riguroso del 
Calculo. En 1820, Cauchy obtuvo el primer «teorema de existencia» para las 
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ecuaciones diferenciales. Demostro que toda ecuacion de primer orden de la forma 

/ =f(x,y) 

tiene solucion, siempre que el segundo miembro, fix, y), satisfaga ciertas condi- 
ciones generates. Un ejemplo importante es la ecuacion de Ricatti 

/ = /•(*)/ + Q(x)y + R(x), 

en la que P, Q y R son funciones dadas. El trabajo de Cauchy implica la existen- 
cia de una solucion de la ecuacion de Ricatti en cualquier intervalo abierto (— r, r) 
en torno al origen, con tal que P, Q y R admitan desarrollos en serie de potencias 
en ( — r, r). En 1841 Jose Liouville (1809-1882) demostro que en algunos casos 
esa solucion no puede obtenerse con medios elementales. 

La experiencia ha puesto de manifiesto que es diffcil obtener resultados de 
tipo general relativos a las soluciones de las ecuaciones diferenciales, salvo para 
unos pocos tipos. Entre estos cabe citar las llamadas ecuaciones diferenciales 
lineales que se presentan en gran numero de problemas cientificos. En el Volu- 
men I se estudiaron algunos tipos sencillos, las ecuaciones lineales de primer 
orden y las de segundo orden con coeficientes constantes. La siguiente seccion se 
dedica a una revision de los principales resultados relativos a esas ecuaciones. 


6.2 Revisi6n de los resultados relativos a las ecuaciones de primero y segundo 
orden 

Una ecuacion diferencial lineal de primer orden es de la forma 
(6.1) / + P(x)y = Q(x)» 

donde P y Q son funciones dadas. En el Volumen I demostramos un teorema de 
existencia y unicidad para esa ecuacion (teorema 8.3) que aquf volvemos a 
enunciar. 

teorema 6.1. Supongamos que P y Q son continuas en un intervalo abierto 
J. Elijamos cualquier punto a en J y sea b un numero real cualquiera. Entonces 
existe una y sdlo una funcidn y = f(x) que satisface la ecuacion diferencial (6.1) 
y la condition initial fia) = b. Esa funcidn viene dada por la fdrmula 

(6:2) f{x) = be~ Aix) + e~ Mx) j“ (2(^)^ <^, dt, 


donde A(x) = $%P(t) dt. 
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Las ecuaciones lineales de segundo orden son las de la forma 

AW/' + AW/ + AW/ = R(x). 

Si los coeficientes P 0 , Pi, P 2 y el segundo miembro R son continuas en un cierto 
intervalo /, y si P 0 no es nulo en ningun punto de /, un teorema (que se discute 
en la seccion 6.5) garantiza que siempre existen soluciones en el intervalo /. Sin 
embargo, no existe una formula general analoga a la (6.2) para expresar esas 
soluciones en funcion de P 0 , A, P 2 y R. A si pues, en esta generalization relativa- 
mente sencilla de (6.1), la teoria no es ni mucho menos completa, excepto en 
casos particulares. Si los coeficientes son constantes y si R es cero, todas las so¬ 
luciones pueden determinarse explicitamente por medio de polinomios y funciones 
exponenciales y trigonometricas segun afirma el siguiente teorema que se demos- 
tro en el Volumen I (teorema 8.7). 

teorema 6.2. Consideremos la ecuacion diferencial 
(6.3) y" + ay' + by = 0, 

donde a y b son constantes reales dadas. Sea d = a 2 — 4b. Toda solucidn de 

(6.3) en el intervalo (—«>, + °°) tiene la forma 

(6.4) y — g-^fCiiqW + c 2 m 2 W], 

donde c x y c 2 son constantes, y las funciones u t y u? se determinan de acuerdo 
con el signo algebraico de d como sigue: 

a) Si d = 0, u^x) — 1 y u 2 (x) = x. 

b) Si d > 0, u,(x) = e kx y u 2 (x) = e~ k *, donde k = \\[d. _ 

c) Si d < 0, W = cos kx y u 2 (x) ~*= sen kx, donde k = \\j—d 

El numero d = a 2 — 4b es el discriminante de la forma cuadratica 


(6.5) r* + ar + b*= 0. 

Esta es la llamada ecuacidn caracteristica de la ecuacion diferencial (6.3). Sus rai- 
ces son 


r, = 


—a -f • **] d 


r 2 = 


—a — d 


2 


2 
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El signo de d determina la naturaleza de esas rai'ces. Si d > 0 ambas rakes son 
reales y la solucion de (6.4) puede expresarse en la forma 


y = c 1 e rix + c 2 e nx . 


Si d < 0, las rakes r t y r 2 son numeros complejos conjugados. Cada una de las 
funciones exponenciales complejas fx(x) = e r ' x y f 2 (x) = e' 2 * es una solucion com- 
pleja de la ecuacion diferencial (6.3). Obtenemos soluciones reales examinando las 
partes real e imaginarias de f x y f 2 . Escribiendo r 1 = —\a + ik, r 2 — — § a — ik , 
siendo k — —d, tenemos 

Ux) = e riX = e ~ ax/2 e ikx — e~ axn co% kx + ie~ ax/2 senkx 

y 

/,(*) = = e - ax/2 e~ ikx = e“ ax/2 cos kx - ie~ ax/2 senkx. 

La solucion general que aparece en la ecuacidn (6.4) es una combinacion lineal 
de las partes real e imaginaria de f^x) y f 2 (x). 

6.3 Ejercicios 


Estos ejercicios han sido seleccionados deli capftulo 8 del volumen I y constituyen una 
revisidn sobre las ecuaciones diferenciales de prixnero y segundo orden. 

Ecuaciones lineales de primer orden. En los ejercicios 1, 2, 3, resolver el problema de 
valores iniciales en el intervalo que se cita. 

1. y' — 3y = e“ en (— °°, + °°), con y = 0 cuando x = 0. 

2. xy’ — 2y = x s en (0, + °°), con y = 1 cuando x = 1. 

3. y' +y tan x = sen 2x en ( — Jw, j-rr), con y — 2 cuando x = 0. 

4. Si una cepa de bacterias crece proporcionalmente a la cantidad de individuos presente 
y si la poblacidn se dobla en una hora, icuanto crecera al cabo de dos horas? 

5. Una curva de ecuacidn cartesiana y = fix) pasa por el origen. Por un punto arbitrario 
de la curva se trazan rectas paralelas a los ejes coordenados que forman un rectangulo 
con ellos. La curva divide todo rectangulo de esos en dos regiones A y B, una de las 
cuales tiene un area igual 9 n veces la otra. Hallar la funcion f. 

6. a) Sea u una solucidn no nula de la ecuacidn de segundo orden y"+ P(x)y’ f Qix) y = 0. 
Demostrar que la sustitucidn y = uv convierte la ecuacidn 

y" + P(x)y’ + Q(x)y = R(x) 

en una ecuacidn lineal de primer orden en v'. 

b) Obtener una solucidn no nula de la ecuacidn y" — 4y' + x 2 (y' — 4y) = 0 por simple 
inspeccion y emplear el metodo de la parte a) para encontrar una solucidn de 


y" - 4/ + x 2 (y' - 4y) = 2xe~ xl l 3 
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tal que y = 0 e y' = 4 cuando x = 0. 

Ecuaciones lineales de segundo orden con coeficientes constantes. En cada uno de los 
ejercicios del 7 al 10, hallar todas las soluciones en (—00,4-00). 


7. y" - 4y = 0. 9 . y" - 2/ + 5y = 0. 

8. y" + 4y — 0, 10. y" 4- 2 y' + y = 0. 


11. Hallar todos los valores de la constante k tales que la ecuackin diferencial y" 4 - fey = 0 
admita una solucion no trivial y = ft(x) para la que j t ( 0) = /*( 1) = 0. Para cada uno 
de esos valores de k, determinar la correspondiente solucidn y = ft(x). Considerar los 
valores de k positivos y negativos. 

12. Si (a, b ) es un punto dado del piano y m es un numero real dado, demostrar que la 
ecuacion diferencial y" 4 - k 2 y = 0 tiene exactamente una solucidn cuya grafica pasa por 
el punto (a, b) y tiene en el pendiente m. Discutir separadamente el caso k = 0. 

13. En cada caso, hallar una ecuacion diferencial lineal de segundo orden que se satisfaga 
con Mi y u 2 . 

a) «i(x) = e x , u 2 (x) = e~ x . 

b) u x (x) - e 2x , u 2 (x) = xe 2x . 

c) u x (x) — e~ x/2 cos x, u 2 (x) =e~ x,2 senx. 

d) «i(x) = sen (2x 4 - 1), u 2 (x) = sen (2x + 2). 

e) u-l(x) = cosh x , u 2 (x) = senh x. 

14. Una partfcula esta sometida a movimiento armdnico simple. Inicialmente estd situada en 
el punto 1, su velocidad es 1 y su aceleracion es —12. Calcular su posicidn y aceleracidn 
cuando la velocidad sea Vg 


6.4 Ecuaciones diferenciales lineales de orden n 

Una ecuacion diferencial lineal de orden n es de la forma 

(6.6) P 0 {x)y {n) 4- H-+ PJ x )y = R (x) ■ 

Las funciones P 0 ,P 1 ,... ,P„ que multiplican las diversas derivadas de la funcion 
incognita y se llaman coeficientes de la ecuacion. En nuestra discusion general de 
la ecuacion lineal supondremos que todos los coeficientes son funciones continuas 
en un cierto intervalo /. La palabra «intervalo» se referira a un intervalo acotado 
o no acotado. 

En la ecuacion diferencial (6.6) el coeficiente P 0 desempena un papel especial, 
puesto aue determina el orden de la ecuacion. Los puntos en los que P 0 (x) = 0 
se llaman puntos singulares de la ecuacion. La presencia de puntos singulares in¬ 
troduce, algunas veces, complicaciones que requieren un estudio especial. Para 
evitarlas supongamos que la funcion P„ nunca- es cero en /. Entonces podemos 
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dividir ambos miembros de la ecuacidn (6.6) por P„ y escribir la ecuacidn dife- 
rencial con primer coeficiente igual a 1. Por consiguiente, en nuestra discusion 
general supondremos que la ecuacion diferencial tiene la forma 

(6.7) /”> + AWf' 11 + • • • + P n (x)y = R(x). 


El estudio de las ecuaciones lineales puede simplificarse mediante el uso de 
la notacion de operadores. Designemos con (/) el espacio lineal constituido por 
todas las funciones de valores reales, continuas en un intervalo /, y con r € ”(/) el 
subespacio de todas las funciones / cuyas n primeras derivadas / (n > 

existen y son continuas en /. Sean P 1 ,... ,P„,n funciones dadas en V (/) y con 
sideremos el operador L: ( €\]) -*%?()) dado por 

L(f) =/<”» + PJ*-" + • • • + P n f. 

El operador L a veces se escribe asi: 

L — D n + P,/)”- 1 + • • • + P n , 

donde D k representa el operador derivada A;-esima. Con esa notacion la ecuacidn 
diferencial (6.7) puede escribirse como sigue 

(6.8) L(y) = R. 

Una solucion de esta ecuacion es cualquier funcidn y de ^ ”(/) que satisfaga (6.8) 
en el intervalo /. 

Es facil comprobar que L{y i + y 2 ) =L( yi) + L(y 2 ), y que L(cy) = cL(y) 
cualquiera que sea la constante c. Por lo tanto L es un operador lineal. Por ello 
la ecuacion L(y) = R se denomina lineal. El operador L se llama operador dife¬ 
rencial lineal de orden n. 

A cada ecuacion lineal L( y) — R podemos asociar la ecuacion 

My) = 0, 

en donde el segundo miembro se ha sustituido por cero. Esta se llama ecuacidn 
homogenea correspondiente a L(y) = R. Cuando R no es identicamente cero, la 
ecuacidn JL(y) = R es una ecuacidn no homogenea. Encontraremos que siempre 
podemos resolver la ecuacidn no homogenea si nos es posible resolver la corres¬ 
pondiente ecuacidn homogenea. Por consiguiente, comenzaremos estudiando las 
homogeneas. 

El conjunto de soluciones de la ecuacidn homogenea es el nucleo N(L) del 
operador L. Este se llama tambien el espacio solucion de la ecuacidn. El espacio 
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solucion es un subespacio de n (J)■ Si bien #”(./) es de dimension infinita, 
resulta que el espacio solucion N(L) siempre es de dimension finita. En efecto, 
demostraremos que 

(6.9) dimN(L)=n, 

siendo n el orden del operador L. La ecuacion (6.9) es el llamado teorema de 
dimensionalidad para los operadores diferenciales lineales. El teorema de di- 
mensionalidad se deducira como consecuencia de un teorema de existencia y 
unicidad que a continuacion comentamos. 

6.5 Teorema de existencia y unicidad 

TEOREMA 6.3. TEOREMA DE EXISTENCIA Y UNICIDAD PARA ECUACIONES LI¬ 
NEALES de orden n. Sean P,, P 2 , .. ., P n funciones continuas en un intervalo 
abierto J, y sea L el operador diferencial lineal 

L = D n + P 1 D n ~ 1 + ■■■ + P n . 

Si x 0 e J y si k 0 , k u ..., k n ~i son n numeros reales dados, existe entonces una 
y solo una funcion y = j(x) que satisface la ecuacidn diferencial homogenea 
L(y) = 0 en J y que tambien satisface las condiciones iniciales 

/(*o) = *o,/'(*o) = k lt ... ,/< n - 1 >(x 0 ) = k n ^. 

Observation: El vector del n-espacio dado por ( f(.x 0 ),f'(x t ) ./ ln -‘’(*o)) se llama 

vector-valor initial de / en x 0 . El teorema 6.3 nos dice que si elegimos un punto xo 
en / y un vector en el n-espacio, la ecuacidn homogenea L(y) = 0 tiene exacta- 
mente una solucion y =f(x) en / con aquel vector como valor inicial en Xo. Por 
ejemplo, cuando n = 2 existe exactamenle una solucidn con valor asignado /(x») y 
derivada asignada f'(xo) en el punto Xo. 

La demostracion del teorema de existencia y unicidad se obtendra como 
corolario de los teoremas de existencia y unicidad mas generales que se estudian 
en el capitulo 7. En la seccion 7.9 se estudia otra demostracion para el caso de 
ecuaciones con coeficientes constantes. 

6.6 Dimension del espacio solucion de una ecuacion lineal homogenea 

TEOREMA 6.4. TEOREMA DE DIMENSIONALIDAD. Sea L\ Un 

operador diferencial lineal de orden n dado por 


(6.10) 


L = D n + PjZ)” -1 + ••• +P n . 
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Etitotices el espacio solucidn de la ecuacion L(y) = 0 tiene dimensidn n. 

Demostracion. Sea V n el espacio lineal n-dimensional de las n-plas de esca- 
lares. Sea T la transformation lineal que aplica cada funcion / del espacio solu¬ 
tion N(L) en el vector-valor inicial de f en x 0 , 

T(f) = (/(*„), /'(*o), • • • ,/ <n - 1) (^ 0 )), 

siendo x 0 un punto fijo en /. El teorema de unicidad nos dice que T{f) = 0 
implica que / = 0. Por consiguiente, segun el teorema 2.10, T es uno a uno 
en NIL). Luego T~ x tambien es uno a uno y aplica V„ en N(L), y el teorema 
2.11 demuestra que dim N(L) = dim V„ = n. 

Puesto que el espacio solucion tiene dimensidn n, un conjunto cualquiera 
de n soluciones independientes servira de base. Por consiguiente, como corolario 
del teorema de dimensionalidad tenemos: 

teorema 6.5. Sea L: ( £ n (J) -* ^(J) un operador diferencial lineal de 
orden n. Si u, ,.. , u„ son n soluciones independientes de la ecuacion diferencial 
homogenea L(y) = 0 en f, toda solucidn y = fix) en J puede expresarse en la 
forma 

(6.1D /w=i%w, 

*=i. 

siendo c 1 ,... ,c„ constantes. 

Observacidn: Puesto que todas las soluciones de la ecuacion diferencial L(y) = 0 
estan contenidas en la formula (6.11), la combinacidn lineal del segundo miembro, 
con las constantes arbitrarias Ci..... c n a veces se llama solucidn general de la 
ecuacidn diferencial. 

El teorema de dimensionalidad nos dice que el espacio solucidn de una 
ecuacion diferencial lineal homogenea de orden n tiene siempre una base de n 
soluciones, pero no nos dice como se determina esa base. En realidad, no se 
conoce un metodo sencillo para determinar una base de soluciones para toda 
ecuacion lineal. No obstante, se han ideado metodos especiales para casos par- 
ticulares. Entre estos cabe considerar las ecuaciones diferenciales con coeficientes 
constantes que volvemos ahora a considerar. 

6.7 Algebra de operadores de coeficientes constantes 

Un operador A de coeficientes constantes es un operador lineal de la forma 
A = a 0 D n + a x D n ~ x + • • • + a n _ x D + a n . 


( 6 . 12 ) 
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donde D es el operador derivada y a 0 ,a lt ... ,On son constantes reales. Si a„ 0 
el operador se llama de orden n. El operador A puede apliCarse a cualquier 
funcion y con n derivadas en un cierto intervalo, siendo el resultado una fun- 
cion A(y) dada por 

A(y) = a 0 y {n) + ay n ~» + • • • 4- a n ^y’ + a n y. 

En esta seccion, limitamos nuestro estudio a funciones que tienen derivadas de 
cualquier orden en ( — oo,+oo), El conjunto de tales funciones se designara 
con <g’ co y se le llamara clase de las funciones indefinidamente derivables. Si 
y e # c °i entonces A(y) pertenece tambien a 

Las operaciones algebraicas corrientes con las transformaciones lineales 
( adicion, multiplicacidn por escalares, y composicidn o multiplicacion) pueden 
aplicarse, en particular, a los operadores con coeficientes constantes. Sean A y B 
dos operadores con coeficientes constantes (no necesariamente del mismo orden). 
Puesto que la suma A + B y todos los productos XA son tambien operadores con 
coeficientes constantes, el conjunto de todos los operadores con coeficientes cons¬ 
tantes es un espacio lineal. El producto de A por B (en cualquier orden) es 
tambien un operador con coeficientes constantes. Por consiguiente, las sumas, 
productos y productos por escalares de operadores con coeficientes constantes 
satisfacen las leyes conmutativa, asociativa y distributiva ordinarias que cumplen 
todas las transformaciones lineales. Asimismo, puesto que D T D 8 = D s D r para 
todos los enteros positivos r y s, dos operadores con coeficientes constantes cua- 
lesquiera A y B son permutables; AB — BA. 

A cada operador con coeficientes constantes A asociamos un polinomio pa 
llamado polinomio caracteristico de A. Si A viene dado por (6.12), p A es el poli¬ 
nomio que tiene los mismos coeficientes que A. Esto es, para todo r real tenemos 

Pa(t) = <V" + «i r”' 1 + •■■ + a n . * 

Recfprocamente, dado un polinomio real cualquiera p, existe un correspondiente 
operador A cuyos coeficientes son los mismos que los de p. El siguiente teorema 
muestra que tal asociacion entre operadores y polinomios es una correspondencia 
uno a uno. Ademas, esta correspondencia asocia a sumas, productos de operadores 
y productos de escalares por operador las respectivas sumas, productos y produc¬ 
tos por escalares de sus polinomios caracteristicos. 

teorema 6.6. Sean A y B dos operadores con coeficientes constantes con 
polinomios caracteristicos respectivos p A y Pb, y X un numero real. Entonces te¬ 
nemos: 

a) A = B si y sdlo si p A = Pb, 

b) Pa+b — p A + Pb, 

c) Pab = Pa ' Pb, 

d) Pxa = X • p A . 
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Demostracidn. Consideremos primero la parte a). Supongamos p A = Pb. 
Queremos demostrar que A(y) = B(y) para toda y de Puesto que p A = Pb, 
ambos polinomios tienen el mismo grado y los mismos coeficientes. Por consi- 
guiente Ay B tienen el mismo orden y los mismos coeficientes, asf que A(y) = B(y) 
para toda y de 

Seguidamente demostramos que A — B implica p A = p B . La relacion A = B 
significa que A(y) = B(y) para toda y de Tomemos y = e rx , siendo r una 
constante. Puesto que y (i) = rV* para todo k ^ 0, tenemos 

A(y) = J o A (r)e rx , y B(y) = p B (r)e rx . 

La ecuacidn A(y) = B(y) implica p A (r) = p B (r). Ya que r es cualquiera, debe ser 
p A = Pb- Esto completa la demostracidn de la parte a). 

Las partes b), c) y d) se deducen al momento de la definition de polinomio 
caracterfstico. 

Del teorema 6.6 resulta que toda relation algebraica que incluya sumas, pro- 
ductos y productos por escalares de los polinomios p A y p fl son tambien validos 
para los operadores A y B. En particular, si el polinomio caracterfstico p A puede 
factorizarse como producto de dos o mas polinomios, cada factor debe ser el polino¬ 
mio caracterfstico de un cierto operador con coeficientes constantes, asf que segun 
el teorema 6.6 existe una correspondiente factorizacion del operador A. Por ejem- 
plo, si p A (r) — p B (r)pc(r), entonces A = BC. Si p A (r) puede factorizarse como 
producto de n factores lineales, por ejemplo sea 

(6.13) Pa(') = a o(r - rjir - r 2 ) • • • (r - r„ ). 

la correspondiente factorizacion de A toma la forma 

A = a 0 (D - rJ(D — r 2 ) • ■ • (D — r n ). 

El teorema fundamental del algebra nos dice que todo polinomio p A (r) de 
grado n ^ l tiene una factorizacion de la forma (6.13), donde r t , r 2 ,.... r„ son 
las rafces de la ecuacion 


Pa(') = 0, 

llamada ecuacion caracteristica de A. Cada rafz se escribe tantas veces como indica 
su orden de multiplicidad. Las rafces pueden ser reales o complejas. Puesto que 
p A (r) tiene coeficientes reales, las rafces complejas se presentan en pares de con- 
jugadas, a + //?, a — i/3, si ft 0. Los dos factores lineales correspondientes a 
cada uno de tales pares puede combinarse para dar un factor cuadratico 
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r 2 — 2ar + « 2 + /? 2 cuyos coeficientes son reales. Por consiguiente, todo polino- 
mio Pa(t) puede factorizarse como un producto de polinomios lineales y cuadra- 
ticos con coeficientes reales. Esto nos proporciona una correspondiente factoriza¬ 
tion del operador A como un producto de operadores de primer y segundo orden 
con coeficientes constantes y reales. 

ejemplo 1. Sea A = D 2 — 5D + 6. Puesto que el polinomio caracterfstico 
p^(r) tiene la factorizacion r 2 — 5r + 6 = (r — 2 )(r — 3), el operador A tiene 
la factorizacion 


D 2 - 5D + 6 = (D - 2 )(D - 3). 


ejemplo 2. Sea A = D* — 2D 3 + 2D 2 — 2D + 1- El polinomio caracte¬ 
rfstico p A (.r) tiene la factorizacion 

r 4 — 2 r 3 + 2r 2 — 2r + l = (r — 1 )(r — 1 )(r 2 1), 

asf que A tiene la factorizacion A — (D — 1)(D — 1)(D 2 +1). 

6.8 Determinacion de una base de soluciones para ecuaciones lineales con coe¬ 
ficientes constantes por factorizacion de operadores 

El teorema que sigue demuestra como la factorizacion de operadores con 
coeficientes constantes nos ayuda en la resolucion de ecuaciones diferenciales linea¬ 
les con coeficientes constantes. 

teorema 6.7. Sea L un operador con coeficientes constantes que puede fac¬ 
torizarse como un producto de operadores con coeficientes constantes, por ejemplo 

L — AiA% ' A k . 

Entonces el espacio solution de la ecuacion diferencial lineal L(y) = 0 contiene 
el espacio solution de cada una de las ecuaciones diferenciales Ai(y) = 0. Dicho 
de otro modo, 

(6.14) N(Aj) £ N(L) para cada i = 1,2,... ,k. 

Demostracion. Si u es el nucleo del ultimo factor Ak tenemos Ak(u) — 0, 
asf que 


L(u) = (A,A 2 ■ ■ ■ A k )(u) = (A • ■ • A k _MM = (A • • • A-i)(0) = 0. 
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Por lo tanto, el nucleo de L contiene el nucleo del ultimo factor Ak. Pero ya que 
los operadores con coeficientes constantes son permutables, podemos reordenar 
los factores de modo que uno cualquiera de ellos sea el ultimo factor. Esto de- 
muestra (6.14). 

Si L(u) = 0, se dice que el operador L anula u. El teorema 6.7 nos dice que 
si un factor At de L anula u, tambien L anula u. 

Vamos a ver como puede utilizarse el teorema para resolver las ecuaciones 
diferenciales homogeneas con coeficientes constantes. Hemos elegido ejemplos 
para ilustrar distintos aspectos, que dependen de la naturaleza de las rafces de 
la ecuacion caracteristica. 

CASO I.. Raices reales distintas. 

ejemplo 1. Hallar una base de soluciones para la ecuacion diferencial 
(6.15) (Z> 3 — ID + 6)j = 0. 

Solucion. Tiene la forma L(y) = 0 con 

L = D* - ID + 6 = (D - 1 )(Z> - 2 ){D + 3). 

El nticleo de D - 1 contiene u,(x) = e*, el de D — 2 contiene u 2 (x) = e 2x , y 
el de D + 3 contiene u 3 (x) = e~ 3x . En el capftulo 1 (p. 12) se demostro que 
«i, « 2 , u 3 son independientes. Puesto que tres soluciones independientes de una 
ecuacion de tercer orden forman una base para el espacio solucion, la solucion 
general de (6.15) viene dada por 

y = c 1 e x + c 2 e 2x + c 3 e- 3x . 

El metodo utilizado para resolver el ejemplo 1 nos permite encontrar una 
base para el espacio solucion de cualquier operador con coeficientes constantes 
que'pueda descomponerse en producto de factores lineales distintos. 

teorema 6.8. Sea L un operador con coeficientes constantes cuya ecuacidn 
caracteristica pdf) = 0 tiene n raices reales distintas r 3 , r 2f ..., r„. Entonces la 
solucion general de la ecuacidn diferencial L(y) = 0 en el intervalo (— oo, + oo) 
viene dada por la fdrmula 


y =Ic k e'**. 


k= 1 


( 6 . 16 ) 
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Demostration. Tenemos la factorization 


L = a 0 (D - r x )(D - r 2 ) ■ ■ ■ (D - r n ). 


Puesto que el nucleo de (D — r*) contiene Uk(x) = e T t x , el nucleo de L contiene 
las n funciones 


«i(x) = e r ' x , u 2 (x) <= e r * x ,... , u n (x) — e r « x . 


En el capitulo 1 (p. 12) se demostro que esas funciones son independientes. Por 
consiguiente constituyen una base para el espacio solution de la ecuacion L(y)—0, 
asf que la solution general viene dada por (6.16). 

CASO II. Raices reales multiples. 

Si todas las rafces son reales pero no distintas, las funciones (6.17) no son 
independientes y por tanto no forman una base para el espacio solution. Si una 
rafz r se presenta con multiplicidad m, entonces (D — r) m es un factor de L. 
El teorema que sigue nos dice cdmo obtener m soluciones independientes en el 
nucleo de ese factor. 

teorema 6.9. Las m funciones 

(6.17) u x (x) = e TX , u 2 (x) = xe rx ,... , u m (x) — x m ~ x e rx 

son m elementos independientes anulados por el operador (D — r) m . 

Demostration. La independencia de esas funciones se deduce de la inde¬ 
pendence de los polinomios 1, x, x~,..., x m_1 . Para demostrar que u lt u 2 ,... ,u m 
son anuladas por (D — r) m lo haremos por induction. 

Si m = 1 existe tan solo una funcion, u^x) = e rx , que evidentemente es 
anulada por ( D — r). Supongamos entonces, que el teorema es cierto para m — 1. 
Esto significa que las funciones u x , ..., u m _, son anuladas por (D — r) m_1 . 
Puesto que 


(D - r) m = (D - r)(D - r) m ~ x 


las funciones u 2 ,... ,u m -i tambien son anuladas por (D — r) m . Para completar 
la demostration tenemos que demostrar que (D — r) m anula u m . Consideremos 
por tanto 
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(D - r) m u m = (D - r) m ~\D - r)(x m ~ 1 e n! ). 

Tenemos 

(D - r){x m ~ 1 e rx ) = D(x m ~ 1 e rx ) - rx m ~ l e TX 

— (m — l)x m ~ 2 e rx + x m ~ 1 re rx — rx m ~ l e TX 
= (m- \)x m ~ 2 e rx = (m- l)u m ^(x). 

Cuando aplicamos (D — r)™ -1 a los dos miembros de esta ultima ecuacidn obte- 
nemos 0 en el segundo miembro ya que (D — r) m_1 anula a u m - t . Luego 
(D — r) m u m = 0 con lo cual u m es anulada por (D — r) m . Esto completa la de- 
mostracion. 

ejemplo 2. Hallar la solucidn general de la ecuacidn diferencial L(y) = 0, 
donde L = D 3 - D 2 - 8D + 12. 

Solucidn. El operador L tiene la factorizacidn 

L = (D- 2) 2 (D + 3). 

Segun el teorema 6.9, las dos funciones 

u i(x) — e 2x , u 2 (x) = xe 2 * 

pertenecen al nucleo de (D — 2) 2 . La funcidn u z (x) = er 3x pertenece al nucleo de 
(D + 3). Como quiera que u u u 2 ,u 3 son independientes (ver ejercicio 17 de la 
seccion 6.9) forman una base para el nucleo de L, asi que la solucidn general 
de la ecuacion diferencial es 

y = c^e 2 * + c 2 xe iX + c z e~ 3x . 

El teorema 6.9 nos indica c6mo hallar una base de soluciones para cualquier 
ecuacion lineal de orden n con coeficientes constantes cuya ecuacion caracteristica 
tenga solo raices reales, alguna de las cuales se repita. Si las raices distintas son 
fu r 2 ,.. ■ ,rk y se presentan con las multiplicidades respectivas m 1 , m 2 , ..., ttik, 
la parte de la base que corresponde a r p viene dada por las m p funciones 

w e ,„(*) = x^e"^, donde q = 1, 2,..., m v . 

Cuando p toma los valores 1,2 ,,k obtenemos en total rth + ... + nik fun¬ 
ciones. En el ejercicio 17 de la seccidn 6.9 esbozamos una demostracion haciendo 
ver que todas esas funciones son independientes. Puesto que la suma de las mul- 
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tiplicidades nti +,... + m* es igual a n, el orden de la ecuacion, las funciones 
u p ,q forman una base para el espacio solucion de la ecuacion. 

ejemplo 3. Resolver ja ecuacion (D 6 + 2D 5 — 2D' — D 2 )y = 0. 

Solucion. Tenemos D 6 +2D 5 -2D 3 -D 2 =D 2 (D-l)(D+lf. La parte de 
la base correspondiente al factor £> 2 es Uj(x) = 1, u 2 (x) = x; la parte correspon- 
diente al factor (D — 1) es u 3 (x) = e x ; y la correspondiente al factor (D + l) 3 es 
u 4 (x) = e~ x , u 5 (x) = xe~ x , u 6 (x) = x 2 e~ x . Las seis funciones u x ,.,., u e son in- 
dependientes, asi que la solucion general de la ecuacidn es 

y = c ± + c 2 x + c 3 e* + (c 4 + c s x + c e x 2 )e~~ x . 

CASO III. Raices complejas. 

Si se emplean exponenciales complejas, no hay necesidad de distinguir entre 
raices reales y complejas de la ecuacion caracteristica de la ecuacion diferencial 
L(y) = 0. Si se desean soluciones de valor real, factorizamos el operador L en 
factores lineales y cuadraticos con coeficientes reales. Cada par de raices com¬ 
plejas conjugadas a + iP, « — ip corresponde al factor cuadratico, 

(6.18) D 2 — 2xD + « 2 + P 2 . 

El nucleo de este operador de segundo orden contiene las dos funciones indepen- 
dientes u(x) = e ax cos Px y v(x) = ef* x sen px. Si el par de raices a ± ip se pre- 
senta con multiplicidad m, el factor cuadratico se presenta elevado a la potencia 
m-esima. El nucleo del operador 

[.D 2 - 2 <xD + a 2 + p*] m 

contiene 2m funciones independientes, 

u t (x) = x 9-1 e** cos Px , v q (x) = x^'e™ sen px , q = 1 , 2 , ... , m . 

Esto puede probarse facilmente por induccion respecto a m. (En el ejercicio 20 
de la seccion 6.9 se da un esquema de las demostraciones.) Los ejemplos siguien- 
tes ilustran algunas de las posibilidades. 

ejemplo 4. Y" — 4/' + 13/ = 0. La ecuacion caracteristica, r 3 — 4/ + 
+ 13r = 0, tiene las raices 0, 2 ± 3i; la solucion general es 


y — c x + e to (c 2 cos 3x + c 3 sen 3x). 
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ejemplo 5. /" — 2y" + Ay' — 8y = 0. La ecuacidn caracterfstica es 


r 3 4 5 1 6 — 2r 2 + 4r — 8 = (r — 2)(r 2 -f 4) = 0 ; 
sus rafces son 2, 2i, —2 i, asf que la solucion general de la ecuacion diferencial es 

y = cy 2x + c 2 cos 2x + c 3 sen 2x. 

ejemplo 6. y (5) — 9y (4) + 34/" — 66/' + 65/ — 25y = 0. La ecuacion 
caracterfstica puede escribirse asf 

(r - l)(r 2 - 4r + 5) 2 = 0 ; 

sus rafces son 1, 2 ± i, 2 ± i, por lo que la solucion general de la ecuacion dife¬ 
rencial es 


y = cy? + e to [(c 2 + c 3 x) cos x + (c 4 + c 5 x) sen x ]. 


6.9 Ejercicios 


Hallar la soluci6n general de cada una de 
1 al 12. 


1. /' - 2/ - 3/ = 0. 

2 . y"’ -/, = 0 . 

3. /" + Ay" + 4/ = 0. 

4. y’" -3y" + 3/ -y =0. 

5. v <4) + Ay" + 6v" + 4y' + v = 0. 

6. y <4) — 16y = 0. 


las ecuaciones diferenciales de los ejercicios 


7. y w + 16y = 0. 

8 . f -y = 0 . 

9. y (4> + Ay’" + 8/ + 8/ + 4y = 0. 

10. y w +2/ +y =0. 

11. /«> +4y (4) +4y" =0. 

12. /«> + 8y (4) + 16/ = 0. 


13. Si m es una constante positiva, hallar la solucidn particular y = }(x) de la ecuaci6n di¬ 
ferencial 


y" — my" + m 2 y' — m 3 y = 0 


que satisfaga las condiciones /(0) = /'(0) = 0, /"(0) = 1. 

14. Una ecuacion diferencial lineal con coeficientes constantes tiene la ecuacidn caracteris- 
tica /(r) = 0. Si todas las rafces de la ecuacion caracterfstica son negativas, demostrar 
que toda solucidn de la ecuacion diferencial tiende a cero cuando x —> + «>. ^Que se 
puede asegurar acerca del comportamiento de todas las soluciones en el intervalo 
[0, +<») si todas las rafces de la ecuacion caracterfstica son no positivas? 
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15 . En cada caso, hallar una ecuacion diferencial lineal con coeficientes constantes que se 
satisfaga para todas las funciones dadas. 


a) 

«iW 

= e x , 

k 2 (x) = 

e x , 

II 

to 

« 4 (x) = e~ 2x 

b) 

tti(x) 

— e~ 2x 

, « 2 (x) 

= xe : 

21 , « 3 (x) = 

x 2 e ~ 2x . 

c) 

«i(x) 

= 1, 

= 


u 3 (x) = e x , 

« 4 (x) = xe*. 

d) 

u x {x) 

= X, 

« 2 (x) = 


w 3 (x) = xe x . 


e) 

«lO) 

= X 2 , 

u 2 (x) = 


« 3 <X> = xe x . 


f) 

«iW 

H 

II 

cos 3x, 

u 2 (x) 

= e~ 2x sen 3x, 

« 3 (x) = e -2x 


g) Ul ( x ) = cosh x, u 2 (x) = scnh x, « 3 (x) = x cosh x, « 4 (x) = x senh x. 

h) « x (x) = cosh x sen x, u 2 (x) — senh x cos x, « 3 (x) = x. 

16. Sean ri,...,r„, n numeros reales distintos, y Qi,...,Q„,n polinomios, ninguno de los 
cuales es el polinomio nulo. Demostrar que las n funciones 

«t(x) = Qi(x)e r ' x , .. . , «„(x) = Q n (x)e'n* 


son independientes. 

Bosquejo de la demostracidn. Etnplear la induccion respecto a n. Para n — 1 y 
n = 2 el resultado es facilmente comprobable. Supongamos que la proposition es cierta 
para n = p y sean c,,, c r+I , p + 1 escalares reales tales que 


2 >+l 

I c k Q k (x) e v = o. 


jt=i 


Multipliquemos los dos miembros por e _r »+i x y derivemos la ecuacidn resultante. Em- 
plear entonces la hipotesis de induccion para probar que todos los escalares c k son 0. 
Puede darse otra demostracidn basada en el orden de magnitud cuando x -» + «=, como 
se hizo en el ejemplo 7 de la section 1.7 (p. 12). 

17. Sean m u mi,..., m k , k enteros positivos, y n, n,... , r k , k numeros reales distintos, y 
sea n = m t + ... + m k . Para cada par de enteros p, q que cumplan 1 < p < fc, 
1 < q < m„ pongamos 


«,,»W = x Q ~ 1 e r < >x . 

Por ejemplo, cuando p = 1 las correspondientes funciones son 

«uW = e riX , « 2 ,iW = xe r i x .« mitl (x) = x m i- 1 e r i*. 

Demostrar que las n funciones u, lP asi definidas son independientes. 

[Indicacidn: Aplicar el ejercicio 16.] 

18. Sea L un operador diferencial lineal de orden n con coeficientes constantes y polinomio 
caracterfstico p(r). Sea V el operador de coeficientes constantes cuyo polinomio carac- 
teristico es la derivada p'(r). Por ejemplo, si L = 2D 2 — 3D. + 1 entonces L' = 4D — 3. 
Con mayor generalidad, definamos la derivada m-esima L lm> como el operador cuyo poli¬ 
nomio caracterfstico. es la derivada m-esima p'””(r). (El operador L < “ > no debe confun- 
dirse con la potencia m-esima L m .) 
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a) Si u tiene n derivadas, demostrar que 


k=0 


pM(0) 

k\ 


«<*>. 


b) Si u tiene n — m derivadas, demostrar que 
n \r' p <fc+m, (0) 

L <m) («) = 2 ^ l —__— u(k) para 0,1,2 

*=0 

donde L l0) = L . 

19. Con la notacidn del ejercicio 18. Si u y v tienen n derivadas, demostrar que 


L(uv) =2 

k=0 


£,<*>(«) 

k! 


»<*>. 


[ Indication : Emplear el ejercicio 18 junto con la formula de Leibniz para la 
derivada fc-esima de un producto: 


(uvfV = 2 ( k T )u {k - r) v lr) .] 

r =0 


20. a) Sea p(t) = q(t) m r(t), donde q y r son polinomios y m es un entero positivo. Demos¬ 
trar que p'«) = q(t) m -'s(t), donde s es un polinomio. 

b) Sea L un operador con coeficientes constantes que anula u, siendo u una funcion 

dada de x. Sea M = L'“, la potencia m-esima de L, donde m > 1. Demostrar que cada 
una de las derivadas M', AT, .. ., anulan tambite u. 

c) Con la parte b) y el ejercicio 19 demostrar que M anula cada una de las funciones 

u, xu,.. .,x m ~'u. 

d) Con la parte c) demostrar que el operador ( D 1 — 2aD *f a 1 + / 3 2 )” anula cada una 
de las funciones x q e‘ lx sen fix y x'>e ax cos fix para q = 1,2 ,m - 1. 

21. Sea L un operador de orden n con coeficientes constantes y polinomio caracteristico 
p(r). Si a es constante y u tiene n derivadas, demostrar que 

L(e**u(x)) = 

£-4 k\ 

k=0 


6.10 Relacion entre las ecuaciones homogeneas y no hcnnogeneas 

Volvamos ahora a la ecuacion dlferencial lineal general de orden n con coe¬ 
ficientes que no sean necesariamente constantes. El teorema que sigue describe la 
relacion entre las soluciones de una ecuacion homogenea L(y) = 0 y las de una 
no homogenea L(y) = R(x). 

TEOREMA 6.10. Sea L : ( £ n (J)-+ < g(J) un operador diferencial lineal de orden 
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n. Sean u„, n solutiones independientes de la ecuacidn homogenea L(y)—Q, 

y sea y, una solucidn particular de la ecuacidn no homogenea L(y) = R, donde 
R e <6 (/). Entonces toda solucidn y — f(x) de la ecuacidn no homogenea tiene la 
forma 

(6.19) m = yx(x)+fc k u k (x), 

k= 1 

donde c l3 ... ,c„ son constantes. 

Demostracion. Por la linealidad tenemos L(f—y 1 )=L{f)—L(yi)=R—R=0. 
Por lo tanto / — y x pertenece al espacio solucion de la ecuacidn homogenea 
L{ y) = 0, asf que / — y a es una combinacion lineal de u lt ... ,u„, es decir, 
f — y x — c t Ui + ... + c„u„. Esto demuestra (6.19). 

Puesto que todas las soluciones de L(y) = R se obtienen con (6.19), la suma 
del segundo miembro de (6.19) (con las constantes arbitrarias c lt c 2 ,..., c„) se 
llama la solucidn general de la ecuacidn no homogenea. El teorema 6.10 establece 
que la solucidn general de la ecuacidn no homogenea se obtiene sumando a y x 
la solucidn general de la ecuacidn homogenea. 

Observacidn: El teorema 6.10 tiene una sencilla analogi'a geometrica que 
nos ayuda a profundizar en su significado. Para determinar todos los puntos de un 
piano encontramos un punto del mismo y le sumamos todos los puntos de un piano 
paralelo que pasa por el origen. Para encontrar todas las soluciones de L(y) = R 
encontramos una solucion particular y le sumamos todas las soluciones de la ecua¬ 
cidn homogenea L(y) = 0. El conjunto de soluciones de la ecuacidn no homogenea 
es analogo al piano que pasa por un determinado punto. El espacio solucidn de la 
ecuacidn homogenea es analogo al piano paralelo que pasa por el origen. 


En la practica para utilizar el teorema 6.10 tenemos que resolver dos proble- 
mas: 1) Hallar la solucidn general de la ecuacidn homogenea L(y) = 0, y 2) hallar 
una solucidn particular de la ecuacidn no homogenea L(y) = R. En la proxima 
seccion demostramos que siempre se puede resolver el problema 2) si podemos 
resolver el problema 1). 

6.11 Determinacion de una solucidn particular de la ecuacidn no homogenea. 
Metodo de variacion de constantes 


Volvamos a considerar el problema de la determinacion de una solucidn par¬ 
ticular y, de la ecuacidn no homogenea L(y) = R. Expondremos un metodo 11a- 
mado de variacidn de constantes que nos indica como determinar y x si conocemos 
n soluciones independientes u x ,..., u„ de la ecuacidn homogenea L(y) = 0. 
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El metodo proporciona una solucion particular de la forma 

(6.20) Ji = tVO + • • • + v n u n , 

donde v t .v„ son funciones que pueden calcularse en funcion de u ± , . . . , u n 

y del segundo miembro R. El metodo nos conduce a un sistema de n ecuaciones 
algebraicas lineales que se satisfacen con las derivadas v[,... ,v' n . Este sistema 
siempre puede resolverse debido a que tiene una matriz de coeficientes no sin¬ 
gular. La integration de las derivadas, da entonces las funciones deseadas 
v t ,. . . ,v„. El primero que utilizo el metodo fue Juan Bernoulli para resolver 
ecuaciones lineales de primer orden, y luego Lagrange en 1774 para resolver ecua¬ 
ciones lineales de segundo orden. 

Para el caso de orden n pueden simplificarse los detalles utilizando notacion 
vectorial y matricial. El segundo miembro de (6.20) puede escribirse como un 
producto interior 

(6.21) y 1 = (v,u), 

donde v y u son funciones vectoriales n-dimensionales dadas por 

v = (»!,... , v n ), u = (u lt ... ,u n ). 


Intentamos elegir v de manera que el producto interior que define y 1 satisfaga la 
ecuacion no homogenea L(y) = R, sabiendo que L(u) = 0, donde L(u) = (LfwO , 
.... L(« n )). 

Comenzamos calculando la primera derivada de y,. Encontramos 

(6.22) yi = (a, u') + (v', u). 

Como tenemos n funciones ,... ,v n por determinar, deberemos precisar n 
condiciones que las relacionen. Si imponemos la condicion de que el segundo 
termino del segundo miembro de (6.22) se deba anular, la formula para y{ se 
simplifica y queda 


y' x — ( v , u'), con tal que ( vu) — 0. 


Derivando la relacion que da y[ encontramos 


y'l = (v, u") + (v',u'). 
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Si podemos elegir v de modo que (v', «0 = 0 entonces la formula que da y" 
tambien se simplifica y queda 

y'[ = (v, u"),con tal que tambien(o', u') = 0. 

Si seguimos de este modo con las n — 1 primeras derivadas de y, encontramos 

= (t>, m ( b_i) ), con tal que (v', u {n ~ 2) ) = 0. 

Hasta aqui hemos establecido n — 1 condiciones a v. Derivando una vez mas 
llegamos a 

y[ n) = ( v, u M ) + (o', u'"- 1 ’). 

Impongamos ahora la condition (o', u (n_1) ) = R(x), y la ultima ecuacion se trans¬ 
forma en 

y[ n) — (v, u (n) ) + R(x), con tal que (o', u (n ~ l) ) = R(x). 

Supongamos, por el momento, que se pueden satisfacer las n condiciones impues- 
tas a v. Sea L = D n + P 1 (x)D n ~ 1 + ... + P„(x). Cuando aplicamos L a yi en¬ 
contramos 


L(y 1 ) - y[ n) + P^yl”- 1 ' + • • • + P n (x)y 1 

= {(o, u (n) ) + R(x)} + P^xXv, u <n ~ v ) -I- + P„(x)(v, u ) 

= (v, L(u)) + R(x) = (v, 0) + R(x) = R(x). 


Es decir, L(yJ = R(x), asi que y, es una solucion de la ecuacion no homogenea. 

El metodo tendra exito si se pueden satisfacer las n condiciones que hemos 
impuesto a v. Esas condiciones establecen que (/, u (ky ) = 0 para k = 0,1,..», 
n — 2, y que (i/, u (n ~ !) )= R(x). Podemos escribir esas n ecuaciones en una sola 
ecuacion matricial, 

fol 


W(x)v'(x) = R(x) 


(6.23) 
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donde v (x) se considera como una matriz columna n X 1, y W es la matriz 
nXn cuyas filas estan formadas por los componentes de u y sus derivadas su- 
cesivas: 


u 2 

ul u'i 



u 


(n- 1 ) 
1 


U 


in— 1 ) 
2 


U 


(n—1) 
n 


La matriz W se llama matriz wronskiana de ih ,, u„, en recuerdo de 
J. M. H. Wronski (1778-1853). 

En la seccion que sigue demostraremos que la matriz wronskiana es no 
singular. Por consiguiente, podemos multiplicar ambos miembros de (6.23) por 
W(x)~ s obteniendo 



v'(x) = K(x)W / (x)- 1 


6 

i 


Elijamos dos puntos c y x en el intervalo J que se considera, e integremos esa 
ecuacion vectorial en el intervalo, desde c ax, obteniendo 


donde 


v(x) = v(c) + J R(t)W(t) 1 


dt = v(c) + z(x), 


/ 


z(x)= RO)W(t) 


,-i 


dt. 


La formula y, = (u, v) para la solucion particular toma ahora el aspecto 


yi = ( u , v) = (n, v(c ) + z) = (m, d(c)) + (w, z). 
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El primer termino (u, v(c)) satisface la ecuacidn homogenea puesto que es una 
combinacidn lineal de u,,..., u„. Por consiguiente podemos omitir este termino 
y utilizar el segundo termino («, z) como una solucion particular de la -ecuacidn 
no homogenea. Es decir, una solucidn particular de L(y) = R viene dada por el 
producto interior 

4 


(u(x), z(x)) 




R(t)w(tr 


Observese que no es necesario que la funcion R sea continua en el intervalo /. 
Todo lo que se exige es que R sea integrable en [c, x]. 

Podemos resumir los resultados de esta seccion mediante el teorema siguiente. 


teorema 6.11. Sean «i ,... ,u„, n soluciones independientes de la ecuacidn 
diferencial lineal de orden n homogenea L(y) — 0 en un intervalo J. Entonces 
una solucidn particular yi de la ecuacidn no homogenea L(y) = R viene dada por 
la fdrmula 

n 


donde v t ,,v n son los elementos de la matriz columna v, nX 1, determinada 
por la ecuacidn 


(6.24) 


0 


v(x) - J V»wo _1 


6 

1 


dt. 


En esta formula, W es la matriz wronskiana de u t ,... ,u„, y c es un punto cual- 
quiera de J. 


Observacidti: La integral defmida en (6.24) puede reemplazarse por cualquier 
integral indefinida. 


/ 


R{x)W(x) 1 


dx. 


ejemplo 1. Hallar la solucidn general de la ecuacidn diferencial 

„ 2 

y - y = T-r~m 

1 + e x 


en el intervalo (— oo, 4 - 00 ). 
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Solution. La ecuacion homogenea, (D 2 — ljy = 0 tiene las dos soluciones 
independientes Uj(x) = (f, u 2 (x) = e~ x . La matriz wronskiana de Un y u 2 es 


W(x) = 




e x e~ x 
_e x —e~ x \ 

Puesto que detTV(x) = —2, la matriz es no singular y su inversa viene dada por 

'—e~ x —e~ 

— e* 


Por consiguiente, 


W{x)- 1 


"O' 

1 

~-e~ x ~ 

_1_ 

“ ~2 

1 

I_ 


y tenemos 


R(x)W(x)~ 



L_ _l 

L_ 

-J 

e * 

To] 

i 

1 2 

'-^1 


1 + e x 

_i. 

2\+ e x 

- e x _ 


~e x 


.1 + e*. 


Integrando cada componente del vector del segundo miembro encontramos 

Vi= J dx = | - 1 + y+j) dx = ~ e ' x - * + ] °g (i + «*) 

y 

v 2 (x) = J dx = -log (1 + e x ). 

La solution general de la ecuacion diferencial es, por consiguiente, 

y — c l“lW + c 2 u 2 (x) + l’ 1 (x)w 1 (x) + v 2 (x)u 2 (x) 

= c x e x + c 2 e~ x - 1 - xe* + (e* - <r*) log (1 +<?*). 


6.12 No singularidad de la matriz wronskiana de n soluciones independientes de 
una ecuacion lineal homogenea 

En esta section demostramos que la matriz wronskiana W de n soluciones 
independientes u x ,... ,u n de una ecuacion homogenea L(y) = 0 es no singular. 
Lo vamos a hacer demostrando que el determinante de TV es una funcion exponen- 
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rial que nunca se anula en el intervalo / que se considera. 

Sea w(x) = det W(x ) para cada x de J, y supongamos que la ecuacion dife- 
rencial que se satisface con las funciones u r ,... ,u n tiene la forma 

(6.25) 7 <n) + P 1 (x)/"- 1) + • • • + P n {x)y = 0. 

Tenemos entonces: 

teorema 6.12. El determinante wronskiano satisface la ecuacion diferencial 
de primer orden 

(6.26) w' + Pi (x)w = 0 
en J. Por consiguiente, si c e } tenemos 

(6.27) w(x) = w(c) exp j"-/* P x (0 dt (Formula de Abel). 

Ademas, w{x) 0 para todo x de J. 

Demostracion. Sea u el vector fila u = (u x ,, u„). Ya que cada compo- 
nente de u satisface la ecuacion diferencial (6.25) lo mismo ocurre para u. Las 
filas de la matriz wronskiana W son los vectores u, u', . , u' n ~ v . Luego podemos 

escribir 

w = det W 3=2 det ( u , u',, u (n ~ 1) ). 

La derivada de w es el determinante de la matriz obtenida derivando la ultima fila 
de W (ver ejercicio 8 de la seccion 3.17). Esto es 

w' •= det ( u, u',... , «<”-«, u in) ). 

Multiplicando la ultima fila de w por P,(x) tambien tenemos 
Pi(x)w tss det ( u, , P i {x)u {n ~ 1) ). 

Sumando esas dos ultimas ecuaciones encontramos 

w' + Pi(x)w = det (u, u ',... , M (n - 2) , «<"> + P 1 (x)u*' n - 1) ). 

Pero las filas de este ultimo determinante son dependientes puesto que u satisface 
la ecuacion diferencial (6.25). Por tanto el determinante es cero, lo que significa 
que w satisface (6.26). Resolviendo (6.26) obtenemos la formula de Abel (6.27). 



200 


Ecuaciones diferenciales lineales 


Seguidamente demostramos que w(c) ¥= 0 para un cierto c de /. Lo hacemos 
por reduccion al absurdo. Supongamos que w(t) = 0 para todo t de /. Elijamos 
un t fijo en /, por ejemplo t = t 0 , y consideremos el sistema lineal de ecuaciones 
algebraicas 


!E(r 0 )X= O, 

donde X es un vector columna. Ya que det W(t 0 ) = 0, la matriz W(t 0 ) es singular 
por lo que ese sistema admite una solucion no nula, sea esta X — ,... ,c„) ^ 

(0,..., 0). Utilizando los componentes de este vector no nulo, sea / la combi- 
nacion lineal 


fit) = ^i«i0) + • • • + c n u n (t). 

La funcidn / asi definida satisface L(f) = 0 en / puesto que es una combinacion 
lineal de ,... ,u„. La ecuacidn matricial W(t 0 )Y = O implica que 

m =/'(4) = • • • =/ ( "- 1) (to) = o. 

Por consiguiente, f tiene como valor inicial el vector Oen/ = t 0 , asi que, segun el 
teorema de unicidad, / es la solucion cero. Esto significa = ... = c„ = 0, lo 
lo cual es una contradicci6n. Por lo tan to w(t)¥=0 para un cierto t en /. Tomando 
ese valor de t como c en la fdrmula de Abel vemos que w(x) ¥= 0 para todo * 
de /. Esto completa la demostracidn del teorema 6.12. 

6.13 Metodos especiales para determinar una solucion particular de la ecuacion 
no homogenea. Reduccion a un sistema de ecuaciones lineales de primer 
orden 

Si bien el metodo de variacidn de constantes proporciona un metodo general 
para determinar una solucion particular de L(y) = R, existen metodos especiales 
que a menudo son de aplicacion m£s sencilla cuando la ecuacion tiene ciertas 
formas especiales. Por ejemplo, si la ecuacion tiene coeficientes constantes pode- 
mos reducir el problema al de resolver una sucesion de ecuaciones lineales de 
primer orden. El metodo general queda mejor ilustrado con un ejemplo sencillo. 

ejemplo 1. Hallar una solucion particular de la ecuacidn 
(6.28) ( D - 1 )(D - 2 )y = . 

Solucion. Pongamos u — (D — 2)y. Entonces la ecuacidn se transforma en 


(D - 1 )w = x<?+*\ 
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fista es una ecuacion lineal de primer orden en u que puede resolverse con el 
teorema 6.1. Una solucion particular es 

u = J e x+l2 . 

Sustituyendola en la ecuacion u = (D — 2)y obtenemos 

(D - 2)y = 

que es una ecuacion de primer orden en y. Resolviendola con el teorema 6.1 en- 
contramos que una solucion particular (con yi(0) = 0) viene dada por 

>’iM = \e 2x fj dt. 

Aunque la integral no puede calcularse por medio de funciones elementales, con- 
sideramos la ecuacion como resuelta, puesto que la solucion se expresa por medio 
de integrales de funciones corrientes. La solucion general de (6.28) es 

y — c x e x + c 2 e 2x + \e 2x f e^dt. 

JO 

6.14 Metodo del anulador para determinar una solucion particular de la ecuacion 
no homogenea 

Describimos a continuacion un metodo que se puede utilizar si la ecuacion 
L(y) — R tiene coeficientes constantes y si el segundo miembro R es anulado por 
un operador de coeficientes constantes, a saber A(R) = 0. En principio, el me¬ 
todo es muy sencillo. Aplicamos el operador A a los dos miembros de la ecuacion 
diferencial L(y) = R y obtenemos una nueva ecuacion AL(y) = 0 que debe ser 
satisfecha por todas las soluciones de la ecuacion original. Puesto que Al es otro 
operador con coeficientes constantes podemos determinar su nucleo calculando 
las raices de la ecuacion caracteristica de AL. El problema se reduce entonces a 
determinar, a partir de ese nucleo, una funcion particular yi que satisface 
L{yA = R. Veamos algunos ejemplos. 

ejemplo 1. Hallar una solucion particular de la ecuacion 
(D i - 16)y = x 4 + x + 1 ■ 

Solucion. El segundo miembro, un polinomio de cuarto grado, es anulado 
por el operador D 5 . Por tan to, cualquier solucion de la ecuacion dada tambien lo 
es de la ecuacion 

(6.29) 


D 5 (Z> 4 -16).y = 0. 
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Las raices de la ecuacion caracteristica son 0, 0, 0, 0, 0, 2, —2, 2i, —2i, con lo 
que todas las soluciones de (6.29) se encuentran en la combination lineal 


y = Cl + c 2 x + c 3 x 2 + c 4 x 3 + c 5 x 4 + c 6 e 2x + c ? e 2x + c 8 cos 2x + c 9 sen2x. 


Deseamos elegir las de modo que L(y) = x 4 + x + 1, donde L = D* — 16. 
Puesto que los cuatro ultimos terminos son anulados por L, podemos tomar 
c B = c r = c s — c 9 = 0 e intentamos encontrar c x ,,c s de modo que 

Lfo + c 2 x + c 3 x 2 + c 4 x 3 + c 6 x 4 ) = x 4 + x + 1 . 

Es decir, buscamos una solucion particular y x que sea un polinomio de cuarto 
grado que satisfaga L(y x ) — x 4 + x + 1. Para simplificar escribamos 

16 >y x — ax 4 + bx 3 + cx 2 + dx + e. 

Esto nos da 16_yJ 4 ' = 24a, asf que y\ i] = 3a/2. Sustituyendo en la ecuacion dife- 
rencial L(y,) = x 4 + x + 1 , tenemos que determinar a, b, c, d, e que satisfagan 

I a — ax 4 — bx 3 — cx 2 — dx — e = x 4 + x + 1 . 

Igualando los coeficientes de las potencias semejantes de x obtenemos 
a = — 1 , Z> = c = 0 , d — —l, e = -f, 
de manera que la solucion particular yi viene dada por 

}’l ~ i e xi iVx 3^. 

ejemplo 2. Resolver la ecuacion diferencial y" — 5y' + 6 y = xe x . 
Solucion. La ecuacion diferencial tiene la forma 
(6-30) = 

donde R(x) = xe x y L = D 2 — 5D + 6 . La correspondiente ecuacion homogenea 
puede ponerse en la forma 


{D - 2 ){D - 3)y = 0 ; 


que tiene las soluciones independientes u x {x) = e ix , « 2 (x) = e 3x . 
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Buscamos ahora una solucion particular y 1 de la ecuacion no homogenea. 
Comprobamos que la funcion R(x) — xe 1 es una solucion de la ecuacion homo¬ 
genea 


(.D - 1 fy = 0. 


Por consiguiente, si aplicamos a los dos miembros de (6.30) el operador (D — l) 2 
encontramos que cualquier funcion que satisfaga (6.30) debe tambien satisfacer 
la ecuacion 


(D - 1 )\D - 2){D - 3)y = 0. 

Esta ecuacion diferencial tiene las rafces caracterfsticas 1, 1, 2, 3, por lo que todas 
sus soluciones se encuentran en la combinacion lineal 

y = ae? + bxe x + ce v + de 3x , 

donde a, b, c, d son constantes. Queremos elegir a, b, c, d, de modo que la so¬ 
lucion y, resultante satisfaga L(y,) = xe x . Puesto que L{ce 2x + de 3x ) = 0 cuales- 
quiera que sean los c y d, solo necesitamos elegir a y b de manera que. 
L(ae* 4- bxe x ) = xe 1 y tomamos c = d = 0. Si ponemos 

y 1 — ae x + bxe x , 

tenemos 

D (yi) = (a + b)e x + bxe x , D 2 (y i ) = (a + 2b)e x + bxe x , 
asf que la ecuacion (D 2 — 5D + 6)y t = xe x se convierte en 

(2 a — 3 b)e x + 2 bxe x = xe x . 

Suprimiendo el factor e x e igualando los coeficientes de las potencias semejantes 
de x encontramos a = \,b — \ . Por lo tanto, y x — fe 1 + \xe r - y la solucion 
general de L(y) = R viene dada por la formula 


}' = c x e 2x + c 2 e 3x + je* -f ixe x . 

El metodo utilizado en los ejemplos anteriores se llama metodo del anulador. 
Se podra emplear si podemos encontrar un operador de coeficientes constantes A 
que anule R. A partir de nuestro estudio de las ecuaciones diferenciales lineales 
homogeneas con coeficientes constantes, sabemos que las unieas funciones de valo- 
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res reales anuladas por operadores con coeficientes constantes son combinaciones 
lineales de funciones de la forma 

X m ~ 1 e ax , x m ~ l e* x cos fix , x m ~'e xx sen fix , 

donde m es un entero positivo y a y /3 son constantes reales. La funcion 
y = x m -'e" x es una solucion de una ecuacion diferencial con rai'z caracterfstica a 
de multiplicidad m. Por lo tanto, esta funcion tiene el anulador (D — «)“. Cada 
una de las funciones y = x m ~'e nx cos fix c y = x^'e" 1 sen 'fix es una solucion de 
una ecuacion diferencial con rafces caracterfsticas complejas a ± ifi, con multi¬ 
plicidad m cada una, de modo que son anuladas por el operador [D 2 — 2 aD •+• 
+ (« 2 + /? 2 )] m . Para facilitar la resolucion de algunos ejercicios, damos una 
lista de esos anuladores en la tabla 6.1, junto con alguno de sus casos particulares. 


Tabla 6.1 



Funcion 

Anulador • 

y = x”- 1 


D m 

y = e xx 


D - a 

y = X m ~ 1 e xx 


(Z> - a) m 

y = cos fix o 

y = sen fix 

D 2 + fi 2 

y — x m_1 cos fix 

o y = x m ~ l sen /3x 

(D 2 + fi 2 ) m 

y = e xx cos fix o y == e M sen fix 

D 2 - 2a D + (a 2 + fi 2 ) 

y = x m ~ 1 e c,x cos /Sx 

o y = x m ~ 1 e xx sen fix 

[D 2 - 2a D + (a 2 + fi 2 )] m 


Aunque el metodo del anulador es muy eficaz cuando se puede aplicar, se 
limita a las ecuaciones cuyos segundos miembros R tienen un anulador con coe¬ 
ficientes constantes. Si R(x) tiene la forma e x \ log x, o tan x, el metodo no se 
podra aplicar; tenemos entonces que utilizar la variacion de constantes o algun 
otro metodo para encontrar una solucion particular. 


6.15 Ejercicios 


En cada uno de los ejercicios 1 al 10, hallar la solucion general en el intervalo 


(— °°,+ ®°). 

1 . / -/ =* 2 - 

2. y" - 4y = e 2x . 

3. y" + 2/ = 3xe x . 

4. y" +4 y — sen x . 

5. y" -2/ + y = e x + e 2x . 


6. /" -/ =e x . 

7. y” - y' = e x + e~ x . 

8. y'" + 3y" +3 / + y = xe~ x 

9. y" + y = xe x sen 2x. 

10 . y w - y = x 2 e~ x . 
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11. Si un operador con coeficientes constantes A anula / y si un operador con coeficientes 
constantes B anula g, demostrar que el producto AB anula / + g. 

12. Sea A un operador con coeficientes constantes con polinomio caracteristico p A . 

a) Aplicar el metodo del anulador para demostrar que la ecuacion diferencial 
A(y) = e 7X tiene una solution particular de la forma 


e ax 

}l Pa(*) 

si a no es un cero del polinomio p A . 

b) Si a es un cero simple de p A (multiplicidad 1), demostrar que la ecuacion A (y) = e 7X 
tiene la solucidn particular 


xe* x 

yx ~p^y 

c) Generalizar los resultados de a) y b) cuando a es un cero de p A con multiplicidad m. 

13. Dados dos operadores con coeficientes constantes A y B cuyos polinomios caracteristicos 
no tienen ceros comunes. Sea C = AB. 

a) Demostrar que toda solucion de la ecuacion diferencial C(y) = 0 tiene la forma 
y = y> + y 2 , donde A(yd = 0 y B( y 2 ) = 0. 

b) Demostrar que las funciones yi e y 2 de la parte a) estan determinadas con unicidad. 
Esto es, para una y dada que satisfaga C(y) = 0 existe solo un par yi, y 2 con las pro- 
piedades de la parte a). 

14. Si L(y) = y" 4- ay' + by, donde a y b son constantes, sea / la solucion particular de 
L(y) — 0 que satisface las condiciones /(0) = 0 y /'(0) = 1. Demostrar que una solucion 
particular de- L(y) = R viene dada por la formula 


y x (x) = [V(x - t)R(t) dt 


para cualquier c. En particular, si las rafces de la ecuacion caracteristica son iguales, 
por ejemplo r, = r 2 = m, demostrar que la formula que da y,(x) se convierte en 


yi(x) = e mx j*(x - t)e~ ml R(t)dt. 


15. Sea G el operador «multiplicacion por x». Esto es, Q( y)(x) = x ■ y(x) para cada y de la 
clase “tf” y cada x real. Designemos con / el operador identidad, definido por /(y) = y 
para cada y de 

a) Demostrar que DQ — QD = /. 

b) Demostrar que D ! Q — QD 2 es un operador de primer orden con coeficientes cons¬ 
tantes, y determipar tal operador explfcitamente como un polinomio de primer grado 
en D. 

c) Demostrar que D 3 Q — QD 3 es un operador de segundo orden con coeficientes cons¬ 
tantes, y determinar dicho operador explfcitamente como un polinomio de segundo 
grado en D. 

d) Enunciar la generalizacion sugerida por el operador D n Q — QD", y demostrarla por 
induccion. 
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En cada uno de los ejercicios del 16 al 20, hallar una solucion general de la ecuacion dife- 
rencial en el intervalo que se indica. 

\6. y" - y = \lx, (0, +co). 

17. y" +4 y = sec 2x, 

18. y" — y = sec 3 x — sec x, 

19 / -2/ +y = e‘ x (e* - 1 f, (-oo, +oo). 

.20. y'" — ly" + \4y' —8 y = log x, (0, +oo). 


6.16 Ejercicios varios sobre ecuaciones diferenciales lineales 


1. Una curva integral y = u(x) de la ecuacion diferencial y" — 3y' — 4y = 0 corta a una 
curva integral y = v(x) de la ecuacion diferencial y" + 4y' — 5y = 0 en el origen. De- 
terminar las funciones u y v si las dos curvas tienen la misma pendiente en el origen 
y si 




[»W] 4 5 

x ^°o u(x) 6 

2. Una curva integral y = u(x) de la ecuacion diferencial y" — 4y’ 4- 29y = 0 corta a una 
curva integral y = v(x) de la ecuacion diferencial y" + 4y' + 13y = 0 en el origen. Las 
dos curvas tienen la misma pendiente en el origen. Determinar u y v si w'(7t/2) = 1. 

3. Sabiendo que la ecuacion diferencial y" 4- 4xy' + Q(x)y — 0 tiene dos soluciones de la 
forma y, = u(x) e y 2 = xu(x), donde «(0) = 1, determinar u(x) y Q(x) explicitamente 
en funcion de x. 

4. Sea L(y) = y" + P, y'+ P 2 y. Para resolver la ecuacion no homogenea L(y) = R por el 
metodo de variacion de constantes, necesitamos conocer dos soluciones linealmente inde- 
pendientes de la ecuacion homogenea. Este ejercicio demuestra que si se conoce una 
solucion Ui de L(y) = 0, y si u 2 no se anula en un intervalo /, una segunda solucion u 2 
de la ecuacion homogenea viene dada por la formula 

J ‘ x O(t) 

donde O(x) = e~ sp i Mdx , y c es un punto cualquiera de /. Estas dos soluciones son 
independientes en /. 

a) Demostrar que la funcion u 2 satisface L(y) = 0. 
b) Demostrar que u t y u 2 son independientes en J. 

5. Hallar la solucion general de la ecuacion 


xy" - 2(x + 1)/ + (x + 2)y = x 3 e 2 - 
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para x > 0, sabiendo que la ecuacion homogenea tiene una solution de la forma y=e mz . 

6. Obtener a simple inspection una solution no nula y luego encontrar la solution general 
de la ecuacion diferencial 


O'* - 4y') + x 2 (y' — 4y) = 0 . 


7. Hallar la solucidn general de la ecuacion diferencial 


4 x 2 y" + 4 xy — y — 0, 


sabiendo que existe una solution particular de la forma y = x m para x > 0. 

8. Hallar una solution de la ecuacion homogenea por tanteo, y encontrar luego la solucidn 
general de la ecuacion 


x(l - x)y" - (1 - 2 x)y' + ( x 2 - 3x + 1 )y = (1 - x) 3 . 

9. Hallar la solucion general de la ecuacion 

(2x — 3x?)y" + 4y' + 6 xy = 0, 


sabiendo que tiene una solucion que es un polinomio en x. 

10. Hallar la solucion general de la ecuacion 


x 2 (l - x)y” + 2*(2 - x)y’ + 2(1 + x)y = x 2 , 

sabiendo que la ecuacion homogtitea tiene una solucion de la forma y = x°. 

11. Sea g(x) = If e’/tdt si x > 0. (No intentar el calculo de esta integral.) Hallar todos los 
valores de la constante a tales que la funcion / definida por 


fix) = - er 0 " 1 *) 


satisfaga la ecuacion diferencial lineal 


x 2 /' + (3x - x 2 )/ + (1 - x - e 2x )y = 0. 


Sabiendo esto determinar la solucion general de la ecuacion en el intervalo (0, +°°). 


6.17 Ecuadones lineales de segundo orden con coeficientes analiticos 

Se dice que una funcion / es analitica en un intervalo (x 0 — r,x 0 + r) si / 
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tiene un desarrollo en serie de potencias en ese intervalo, 

fix) = 2 a n(x - x 0 ) n , 

n =0 

convergente para |x — x 0 | < r. Si los coeficientes de una ecuacion diferencial 
lineal homogenea 


y w + Pi(*)/ n_1) H-(- P n (x)y - 0 

son analfticos en un intervalo (x„ — r, + r), puede entonces demostrarse que 

existen n soluciones independientes u x . u«, cada una de las cuales es analitica 

en el mismo intervalo. Demostraremos este teorema para ecuaciones de segundo 
orden y luego discutiremos un importante ejemplo que se presenta en muchas 
aplicaciones. 

teorema 6.13. Sean P x y P 2 analiticas en un intervalo abierto (x 0 — r, 
x 0 + r), tales como 


P&) = 2 b n(x - X 0 ) n , 

71=0 


Pfx) = 2 C n(x ~ x 0 ) n . 

71 =0 


Entonces la ecuacion diferencial 

(6.31) y" + P x (x)/ + P 2 (x)y = 0 

tiene dos soluciones independientes y u 2 que son analiticas en el mismo in¬ 
tervalo. 

Demostracidn. Intentemos encontrar una serie de potencias solucion de la 
forma 

(6-32) y=Ia n (x-x 0 )\ 

71=0 


convergente en el intervalo dado. Para ello, sustituimos las series dadas para 
Pi y P 2 en la ecuacion diferencial y determinamos luego las relaciones que los 
coeficientes a„ deben satisfacer para que la funcion y dada por (6.32) satisfaga 
la ecuacion. 

Las derivadas / e y" pueden obtenerse derivando la serie de potencias de 
y termino a termino (ver teorema 11.9 del Volumen I). Esto nos da 
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/ =Ina n (x - xo)"- 1 = S(n + l)a B+1 (x - x 0 ) n , 

n=l n=0 

y" =2n(n- 1 )a„(x - x 0 ) n ~ 2 = f(n + 2)(n + l)a n+g (x - x„) n . 

n-2 „_ 0 

Los productos Pj(x)/ y P 2 (x)y vienen dados por las series de potencias (*) 
Pi.(*)/ = 2 ( 2 - x 0 ) n 

y 

P 2 (x)y = 2 (2 a * C »-*V X - x o) n - 

n=0\fc=0 / 


Cuando esas series se sustituyen en la ecuacion diferencial (6.31) encontramos 


71=0 ^ 


(« + 2)(n + l)«n+2 + 2 [(^ + l) a fc+l^n-* + 




(X - X 0 )" = 0. 


Por consiguiente, la ecuacion diferencial se satisfara si elegimos los coeficientes 
a„ de modo que satisfagan las formulas recurrentes 


(6.33) (n + 2 )(n + l)a n+2 = - 2 P + 1 K+i&«-* + a k c n _ k ] 

0 


para n — 0, 1,2,.... Esta formula expresa a n+2 en funcion de los coeficientes 
anteriores a 0 ,a x ,..., a„ +1 y los coeficientes de las funciones dadas Pi y P 2 . Elija- 
mos valores arbitrarios de los dos primeros coeficientes a 0 y a x y utilicemos la 
formula recurrente para definir los restantes coeficientes a 2 , a 3 , ..., en funcion de 
a 0 y fli. Esto garantiza que la serie de potencias (6.32) satisfara la ecuacion di¬ 
ferencial (6.31). El siguiente paso de la demostracion es probar que la serie asf 
definida converge realmente para todo x del intervalo (x 0 - r, x 0 + r). Esto se 
hace mayorando la serie (6.32) por otra serie de potencias convergente. Finalmen- 
te, demostramos que podemos elegir a„ y a t para obtener dos soluciones indepen- 
dientes. 

Demostremos ahora que la serie (6.32) cuyos coeficientes estan definidos por 
(6.33) converge en el intervalo indicado. 


(*) Los lectores no familiarizados con la multiplicacidn de series de potencias pueden 
consultar el ejercicio 7 de la seccion 6.21. 
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Elijamos un punto fijo, x x ¥= x 0 en el intervalo (x 0 — r, x 0 + r) y sea 
t = I*! — x„|. Puesto que las series que definen P x y P 2 convergent absolutamente 
para x = x x los terminos de esas series estan acotados, pongamos 

I b t \t*£M 1 y \c k \ t k <, M 2 , 

para ciertos numeros > 0, M 2 > 0. Sea M el mayor de los dos numeros Mi 
y tM 2 ■ Tenemos entonces 

y w 

La formula de recurrencia implica la desigualdad 

n 

(n + 2)(« + 1) \a n+i \ + 1) K + il jL + l«*l 

= + !) t k+1 + ^K + i\ t* +1 + |fl 0 | - |a n+1 | t" +1 ] 

1 Wo k =0 J 

_ _ [ w \ n+1 

^ 2 (fc+ 2) f * +1 + M S* +1} |a *i '*• 

'*=0 I 1 k= 0 

Hagamos ahora A 0 = |« 0 |» Ai = Icql, y definamos A 2 , A 3 ,.. . sucesivamente 
mediante la formula de recurrencia 


if 

(6.34) (« + 2)(« + 1)V, = ~ 2/fc + 1) A k t k 

1 k =0 

para n ^ 0. Entonces |«„| ^ A„ para todo n^O, asi que la serie 2 a„(x — x 0 ) rt 
es mayorada por la serie £ A„\x — x 0 \ n . Aplicamos ahora el criterio del cociente 
para demostrar que £ A„\x — x 0 \ n converge si \x — x 0 | < t. 

Sustituyendo n por n — 1 en (6.34) y restando el producto de la ecuacion 
por t- 1 de (6.34) encontramos que (n + 2)(n + l)A n+2 - t~\n + 1 )nA„ +1 = 
= M(n +2)A„ +1 . Por consiguiente 


y hallamos 


A n +2 — 


(w + l)n + (w + 2)Mt 
(n + 2)(n + l)t 


■^n+2 1* ~ x o\ n+2 _ ( n + 1)» + (« + 2)Mt 
^ n +i I* - *ol" +1 (« + 2)(n + l)t ! ' X ” 0> 



t 
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cuando n -+ °° . Este h'mite es menor que 1 si |x — x 0 | < t. Luego £ Mx — x 0 ) n 
converge si |x — x 0 | < t. Pero ya que t — |xi — x 0 | y que x x es un punto arbitra- 
rio en el intervalo (x 0 — r,x a + r), la serie 2 °n(x — x 0 ) n converge para todo x 
en (x 0 — r, x 0 + r). 

Los dos primeros coeficientes a 0 y a x representan los valores iniciales de y 
y de su derivada en el punto x 0 . Si u x es la serie de potencias solucion con a 0 = 1 
y a x = 0, de manera que 


«iOo) = i y u;(x 0 ) = o, 

y u 2 la solucion con a„ = 0 y a t = 1, de tal modo que 
u 2 (x 0 ) = 0 y u 2 (x 0 ) = 1, 

entonces las soluciones Wi y m 2 seran independientes. Esto completa la demos- 
tracidn. 

6.18 La ecuacidn de Legendre 

En esta seccion encontramos series de potencias soluciones para la ecuacion 
de Legendre, 

(6.35) (1 - x 2 )y" - 2xy' + a(« + l)y = 0, 

donde a es cualquier constante real. Esta ecuacidn se presenta en problemas de 
atraccion y de flujo de calor con simetria esferica. Cuando a es un entero positivo 
encontraremos que la ecuacion tiene soluciones polinomicas llamadas polinomios 
de Legendre. Esos son los mismos polinomios que se encontraron al estudiar el 
proceso de Gram-Schmidt (capitulo 1, pag. 31). 

La ecuacion de Legendre puede escribirse asf: 

[(x 2 - 1)/]' = a(a + l)y, 

que-tiene la forma 

T (y) = Aj, 

en donde T es un operador de Sturm-Liouville, T(f) = (pfY, con p(x) = x 2 — 1 
y A = a(a +1). Por consiguiente, las soluciones no nulas de la ecuacion de Le¬ 
gendre son autofunciones de T correspondientes al autovalor a(a +1). Puesto 
que p(x) satisface las condiciones de contorno 


p(l)=p(-l) = 0. 
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el operador T es simetrico con respecto al producto interior 


(/> g) = j'j(x)g(x) dx. 

La teoria general de los operadores sim&ricos nos dice que las autofunciones co- 
rrespondientes a autovalores distintos son ortogonales (teorema 5.3). 

En la ecuacidn diferencial tratada en el teorema 6.13 el coeficiente de y" es 1. 
La ecuacion de Legendre puede ponerse en esa forma si dividimos por 1 — x 2 . De 
(6.35) obtenemos 


donde 


/' + Pi(x)/ + P t (x)y = 0, 



P*(x) = 


q(q + 1) 

1 -x 2 


si x 2 ¥= 1. Puesto que 1/(1 — x 2 ) = 2n^a x 2a para |x| < 1, y P 2 tienen ambos 
desarrollos en serie de potencias en el intervalo abierto ( —1,1) asf que el teorema 
6.13 es aplicable. Para encontrar la formula de recurrencia para los coeficientes 
es mas sencillo dejar la ecuacion en la forma (6.35) e intentar hallar una serie 
de potencias soluci6n de la forma 


y — 2 a n x ” 


n =0 


valida en el intervalo abierto ( — 1,1). Derivando esta serie termino a tdrmino 
obtenemos 


y = 2 ™ n x n 1 y y" = 2 «(« - l)a„x” -2 

«=1 n =2 

Por lo tanto, tenemos 

2 xy' =2,2 na„x n = f 2 na n x n , 


(1 - x 2 )y" =2<"~ 1 )a n x n ~ 2 - 2 n{n - 1 )a n x n 

»= 2 n =2 

= 2 ( n + 2)(n + 1 )a n+2 x n ~2n(n — 1 )a n x n 

0 71=0 

00 

= ![(« + 2)(n + l)a n+2 - n(n - l)a n ]x". 


n=0 
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Si sustituimos esas series en la ecuacion diferencia! (6.35), vemos que la ecuacidn 
se satisface si, y sdlo si, los coeficientes satisfacen la relacion 


(n + 2 )(n + 1 )a n+2 - n(n - 1 )a n - 2na„ + a(a + 1 )a n = 0 

para todo n ^ 0. Esta ecuacion es la misma que 

{n + 2)(n + 1 )a n+2 - (n - a )(n + 1 + a )a n = 0, 


0 

(6.36) 


^n+2 


(« — n)( a + n + 1) 
(« + l)(n + 2) 


Esta relacidn nos permite determinar a 2 , a it c«,..., sucesivamente en funci6n de 
a 0 . Analogamente, podemos calcular a 3 , a 5 , a r ,..., en funcidn de a x . Para los coe¬ 
ficientes con Indices pares tenemos 


a(a + 1) 

a 2 — , a 0 . 


1 • 2 


a 4 = - 
y, en general. 


( g _ 2)(q + 3) 
3-4 


«2 = (- 1 ) 


2 a(a — 2)(a + l)(a + 3) 

- ( 

4! 


-*o» 


^ i\n a(a - 2) ■ • • (a - In + 2) ■ (a + l)(a + 3) • • • (a + 2n - 1) 
-..-(-l) — - a,. 


Esto puede demostrarse por induccion. Para los coeficientes con indices impares 
encontramos 


a 2n+l 


(- 1 )" 


(a - l)(a - 3) • • • (a - 2n + 1) • (q + 2)(q + 4) • • • (q + 2») 
(2 n + 1 )! a 


Por consiguiente, la serie que define y puede escribirse asf 


(6.37) 

donde 


y = aou^x) + a x u 2 {x). 
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y 

(6.39) 

00 

u 2 (x) = x 


(a - l)(a - 3) • • • (a - 2n + 1) • (« + 2)(g + 4) • • • (a + 2 n) 
(2 n + 1)! 


x 2n+1 


El criterio del cociente demuestra que cada una de esas series converge para 
|x| < 1. Asimismo, ya que la relacion (6.36) se satisface separadamente por los 
coeficientes pares e impares, cada una de las funciones ih y es una solucidn 
de la ecuacidn diferencial (6.35). Esas soluciones satisfacen las condiciones iniciales 


«i(0) = 1, «((0) = 0, u 2 (0) = 0, m 2 (0) = 1. 

Puesto que u x y u 2 son independientes, la soluci6n general de la ecuacidn de Le¬ 
gendre (6.35) en el intervalo abierto ( — 1,1) viene dada por la combinacidn 
lineal (6.37) con las constantes arbitrarias a c y ch- 

Cuando a es 0 o un entero par positivo, por ejemplo a = 2m, la serie de 
u,(x) se transforma en un polinomio de grado 2m que sdlo contiene potencias 
pares de x. Puesto que tenemos 


g(g — 2) • ■ ■ (g — 2n + 2) = 2m(2m — 2) • • • (2m — 2n + 2) = 2 m! 

(m — n)! 

(g + l)(g + 3) • • • (g + 2n - 1) = (2m + l)(2m + 3) • • • (2m + 2n - 1) 

_ (2m + 2 n) ! m! 

~~ 2 M (2m)! (m + n)\ 


la fdrmula que da u^x) en este caso se transforma en 


(6.40) 


Mj(x) = 1 + 


(mlf y , (2m + 2k)\ ^ 

(2m!) {y ' (m — k)l(m + k) \ (2k )! 


Por ejemplo, cuando a = 0, 2, 4, 6 (m = 0, 1, 2, 3) los polinomios correspon- 
dientes son 


Ml (x) = 1, 1 - 3x 3 , 1 - 10x 2 + V* 4 , 1 - 21x 2 + 63x 4 - H±x*. 


La serie que da « s (x) no es un polinomio cuando a es par debido a que el coefi- 
ciente de x 2n+1 nunca es cero. 

Cuando a es un entero impar, se invierten los papeles de u x y u 2 ; la serie 
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correspondiente a u 2 (x) se convierte en un polinomio y la serie de u } (x) no es un 
polinomio. Concretamente, si « = 2m + 1, tenemos 


(6.41) 


«*(x) = x + 


(m!) 2 1)t (2m + 2/c+l)i ^ 

(2m + 1)! (m - k)l (m + k)l (2k + 1)! 


Por ejemplo, cuando « = 1, 3, 5 (m—Q, 1, 2), los polinomios correspondientes son 


«*W = X, 


_ 5 v 3 

> 


X - ±% 3 


+ 


21 v 5 
5 X . 


6.19 Polinomios de Legendre 


Algunas de las propiedades de las soluciones polinomicas de la ecuacion de 
Legendre pueden deducirse directamente a partir de la ecuacion diferencial o de 
las formulas (6.40) y (6.41). Otras se deducen mas facilmente partiendo de otra 
formula para esos polinomios que deduciremos ahora. 

Obtendremos primero una unica formula que contiene (salvo factores cons- 
tantes) los polinomios (6.40) y (6.41). Pongamos 


(6.42) 


[n/2] 




r=0 


(— t) r (2n — 2r)i ^ 
r ! (n — r )! (n — 2r )! 


donde [n/2] representa el mayor entero — n/2. Demostraremos luego que ese es 
el polinomio de Legendre de grado n introducido en el capitulo 1. Cuando n es 
par, es un miiltiplo constante del polinomio Wi(x) de la ecuacion (6.40); cuando n 
es impar, es un miiltiplo constante del polinomio u 2 (x) de (6.41). (*) Los siete 
primeros polinomios de Legendre vienen dados por las formulas 


P 0 (x) = 1, P t (x) = x, P 2 (x) = |(3x 2 - 1), P 3 (x) = K5x 3 - 3x), 

P 4 (x) = i(35x 4 - 30x 2 + 3), P b (x) = J(63x 5 - 70x 3 + 15x), 
i\s(x) = fe(231x 6 - 315X 4 + 105.x 2 - 5). 

La figura 6.1 muestra las graficas de las cinco primeras de esas funciones en el 
intervalo [ — 1, 1]. 


(*) Cuando n es par, n = 2m, podemos reemplazar el fndice de sumacidn k en (6.40) 
por otro r, siendo r — m — k\ encontramos que la suma (6.40) es el producto de P„(x) por 
una constante. Analogamente, cuando n es impar. un cambio de (ndice transforms la suma 
(6.41) en el producto de P„(x) por una constante. 
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y 



Figura 6.1 Graficas de los polinomios de Legendre en el intervalo [ — 1,1] 

Podemos ahora demostrar que, salvo factores escalares, los polinomios de 
Legendre son los que se obtienen aplicando el proceso de ortogonalizacion de 
Gram-Schmidt a la sucesion de polinomios 1, x, x 2 .con el producto interior 


(/, g) = J^/OOgOO dx. 

Observemos primero que si m ¥= n los polinomios P„ y P m son ortogonales 
porque son autofunciones de un operador simetrico pertenecientes a autovalores 
distintos. Tambien, puesto que P„ tiene grado n y P 0 = 1, los polinomios 
P 0 (x), Pi(x),..., P„(x) engendran el mismo subespacio que l,x,... ,x n . En la 
seccion 1.14, ejemplo 2, construimos otro conjunto ortogonal de polinomios 
yo, yi, y 2 , • • •, tales que y 0 U), yi(x),..., y n (x) engendran el mismo subespacio 
que t,x,... ,x n para cada n. El teorema de ortogonalizacion (teorema 1.13) nos 
dice que, salvo factores escalares, existe un solo conjunto de funciones ortogonales 
con esa propiedad. Luego debe ser 
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para ciertos escalares c„. El coeficiente de x n en y„(x) es 1, as! que c n es el coefi- 
ciente de x n en P„(x). De (6.42) vemos que 

„ Ml 

” 2"(n !) 2 

6.20 Formula de Rodrigues para los polinomios de Legendre 

En la suma (6.42) que define P„(x) observamos que 

(2n - 2r)\ ^„_ 2r = cT_ ^„_ 2r 1 = _1_M 

(n — 2r)! dx n r! (n — r)i n! \ r ) ’ 


donde (") es el coeficiente binomial, y escribimos la suma en la forma 


. In/2] 


Cuando [n/2] < r ^ n, el termino x in ~ ir tiene grado menor que n, por lo que 
su derivada n-esima es cero. Por consiguiente.no se altera la suma si hacemos que 
r recorra los valores de 0 a n. Esto nos da 


P n 0 ) = 


1 d n 
2"n! dx n 



x 2 ”- 2r 


Vemos ahora que la suma del segundo miembro es el desarrollo del binomio 
(x 2 — 1)". Por consiguiente, tenemos 




fista se conoee con el nombre de fdrmula de Rodrigues, en honor de Olinde Ro¬ 
drigues (1794-1851), economista y reformador francos. 

Con la formula de Rodrigues y la ecuacidn diferencial, podemos deducir un 
numero de propiedades importantes de los polinomios de Legendre. Algunas de 
esas propiedades se citan a continuacion. Sus demostraciones estan esbozadas en 
el conjunto de ejercicios que sigue. 

Para cada n ^ 0 tenemos 
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Ademas, P n (x) es el unico polinomio que satisface la ecuacion de Legendre 

(1 — x 2 )/' — 2 xy' + n(n + l)y = 0 

y vale 1 cuando x = 1. 

Para cada 0 tenemos 

Pni-x) = (-1 ) n P n (x). 

Esto demuestra que P„ es una funcion par cuando n es par, y una funcion impar 
si n es impar. 

Ya hemos mencionado la relacion de ortogonalidad, 

/_! P n(x)P m (x) dx = 0 si m n. 

Cuando m = n tenemos la expresion de la norma 

\\PJ 2 “ f 1 [P n (x)fdx = -^~ . 

J ~ 1 2n -p 1 

Todo polinomio de grado n puede expresarse como combinacidn lineal de po- 
linomios de Legendre P 0 ,P ,,P„. En efecto, si / es un polinomio de grado n 
tenemos 


f{x) =^c k P k (x), 

donde 4-0 

2k + \ f 1 

c * = 2 — j_/( x ) p k(x)dx. 

A partir de la relacidn de ortogonalidad resulta que 

J_\ g(x)P n (x) dx = 0 

para todo polinomio g de grado menor que n. Esta propiedad puede usarse para 
demostrar que el polinomio de Legendre P n tiene n ceros reales y distintos situa- 
dos todos en el intervalo ( — 1, 1). 

6.21 Ejercicios 

1. La ecuacion de Legendre (6.35) con a = 0 tiene el polinomio solucion udx) = 1 y una 
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soluci6n no polinomica, dada por la serie (6.41). 

a) Demostrar que la suma de la serie que da u 2 viene dada por 


«aW = 2 lo g 


1 + x 
1 - x 


para |*| < 1 . 


b) Comprobar directamente que la funcidn u 2 de la parte ■ a) es una solucion de la 
ecuacion de Legendre cuando a = 0. 

2. Demostrar que la funcidn / definida por la ecuacidn 


/(*) = 1 - \ log 


1 + x 
1 -a: 


para |x| < 1 satisface la ecuacion de Legendre (6.55) con a — 1. Expresar esta funcidn 
como combinacion lineal de las soluciones u t y Ui dadas por las ecuaciones (6.38) y 
(6.39). 

3. La ecuacidn de Legendre (6.35) puede escribirse en la forma 

[(x 2 ~ 1)/]' - a(a + \)y = 0. 

a) Si a, b, c son constantes siendo a > i y 4c + 1 > 0, demostrar que la ecuacidn dife- 
rencial del tipo 


l(x - a)(x - b)y'\ - cy = 0 

puede transformarse en una ecuacion de Legendre mediante un cambio de variable de 
la forma x = At + B, con A > 0. Determinar A y B en funci6n de a y b. 
b) Utilizar el metodo sugerido en la parte a) para transformar la ecuacidn 

(x* - x)y" + (2x - 1)/ -2^=0 


en una ecuacidn de Legendre. 

4. Hallar dos soluciones independientes, en forma de serie de potencias, de la ecuacidn 
de Hermite 


y" - 2xy + 2ay = 0 

en un intervalo de la forma (— r, r). Demostrar que una de esas soluciones es un poli- 
nomio cuando a es entero no negativo. 

5. Hallar una serie de potencias solution de la ecuaci6n diferencial 

xy" + (3 + x?)y' + 3x 2 y = 0 

v^lida para todo x. Hallar una segurjda solucidn de la forma y = x * Ym’ valida para 

X 5* 0. z ' 

6. Hallar una serie de potencias solucidn de la ecuacidn diferencial 


x 2 y" 4- x 2 y’ - (ax + 2)y = 0 
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valida en un intervalo de la forma (— r, r). 

7. Dadas dos funciones A y B analiticas en un intervalo (x 0 — r,x o + r), 

A(x) = a n (x - x 0 ) n , B(x) = J bjx - x 0 ) n . 

n=0 n=0 

Puede demostrarse que el producto C(x) = A(x)B{x) es tambidn analitica en (x 0 — r, 
Xo + r). Este ejercicio demuestra que C tiene el desarrollo en serie de potencias 


oo n 

C(x) = 2 C„(x - x 0 ) n , donde c n = £ . 

n-0 jfc=0 

a) Con la regia de Leibniz para la derivada n-dsima de un producto demostrar que la 
derivada n-esima de C viene dada por 



b) Hacer uso del hecho de que A <k '(xo) = k\ a k y B <n ~ h) (x a ) = (n — k)\ b n -k para obtener 


C<">(x 0 ) ~n\fa k b^ h . 

k~Q 

Puesto que C w (x 0 ) = n! c„, queda demostrada la fdrmula que da c„. 

En los ejercicios del 8 al 14, P„(x) designa el polinomio de Legendre de grado n. Esos 
ejercicios dan el esquema de las demostraciones de las propiedades de los polinominos de 
Legendre descritas en la seccidn 6.20. 

8. a) Con la formula de Rodrigues demostrar que 

PnW = ~ (x + 1)" +(x- 1)GnW, 


donde Q n (x) es un polinomio. 

b) Demostrar que P„( 1) = 1 y que P„( —1) = (—1)*. 

c) Demostrar que P„(x) es el unico polinomio solucidn de la ecuaci6n de Legendre 
(con a = n) que tiene valor 1 cuando x = 1. 

9. a) Utilijzar las ecuaciones diferenciales a las que satisfacen P n y P m para demostrar que 

[(1 — x i )(P n P m — = [n(n + 1) — m(m + l)]P„P m . 

b) Si m ^ n, integrar la ecuaci6n del apartado a) desde —1 a 1 para dar otra demos 
tracidn de la relacidn de ortogonalidad 

/_! WmW dx = 0. 
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tO. a) Sea f(x) = (x* — i)”. Con la integration por partes demostrar que 

j 1 _ 1 f M (x)f (n \x) dx = - j 1 _ i f <n+1) (x)f n - 1 \x) dx. 

Aplicar esta formula reiteradamente para deducir que la integral del primer miembro 
es igual a 


2(2”)! Jo (1 ~ x2 ) n dx. 


b) La sustituciOn x = cos t transforma la integral JJ (1 — x 1 )'dx en Jjj /2 sen Jn+1 / dt. 
Emplear la relaciOn 



sin a " +1 1 dt 


2n(2n - 2) • • • 2 
( 2 n + 1 )( 2 n — 1 ) • • • 3 • 1 


y la formula de Rodrigues para obtener 


jjP n (x)?dx = 


2 

2 « + 1 ’ 


11. a) Demostrar que 


( 2 «)! 

Pn(x) = 2 ^ 7 ) 2 ^" + Qn(x), 
donde Q„(x) es un polinomio de grado menor que n. 

b) Expresar el polinomio f(x) = x* como combinaciOn lineal de Pd, Pi, Pi, Pi, y P* ■ 

c) Demostrar que todo polinomio f de grado n puede expresarse como combinaciOn 
lineal de los polinomios de Legendre Pd, Pi, ..., P„. 

12. a) Si / e's un polinomio de grado n, escribir 

fix) = 2 CkPkix ). 

k =0 

[Esto es posible segun el ejercicio 11 c).] Para un m fijo, 0 < m < n, multiplicar ambos 
miembros de esa ecuaciOn por P m (x) e integrar entre — 1 y 1. Teniendo en cuenta los 
ejercicios 9 b) y 10 b) deducir la relaciOn 

2m + 1 f 1 

Cm 2 J f (x')P m (x') dx . 

13. Utilizar los ejercicios 9 y 11 para demostrar que Jij g(x)P n (x) dx = 0 para todo polinomio 
g de grado menor que n. 
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14. a) Con el auxilio del teorema de Rolle demostrar que P„ no puede tener ceros multiples 
en el intervalo abierto (—1,1). Es decir, los ceros de P„ que estan en (—1,1) deben 
ser ceros simples. 

b) Supongamos que P„ tiene m ceros en el intervalo (—1,1). Si m = 0, sea Qo(x) = 1. 
Si m > 1, sea 

Gm(x) = (x - xjix - x 2 ) ■ ■ ■ (x - x m ), 

donde x u x 2 ,..x m son m ceros de P„ en ( — 1, 1). Demostrar que, en cada punto x de 
(—1,1), Q m (x) tiene el mismo signo que P„(x). 

c) Con el apartado b) y el ejercicio 13, demostrar que la desigualdad m < n nos lleva 
a una contradiction. Esto demuestra que P„ tiene n ceros reales distintos, todos situados 
en el intervalo abierto ( — 1,1). 

15. a) Demostrar que el valor de la integral P„(x)P' +1 (x) dxes independiente de n. 
b) Calcular la integral j*, x P n {x)P n _ x (x) dx . 

6.22 Metodo de Frobenius 

En la seccion 6.17 aprendimos a encontrar soluciones, en forma de series de 
potencias, de la ecuacion diferencial 

(6.43) y" + AM/ + P 2 (x)y = 0 

en un entorno del punto x 0 en el que los coeficientes P 1 y son analfticos. Si uno 
de los dos P 1 o P 2 no es analitico en las proximidades de x 0 , pueden o no existir 
series de potencias solucion en el entorno de x„. Por ejemplo, supongamos que in- 
tentamos encontrar una serie de potencias solucion de la ecuacion diferencial 


(6.44) x y - / - y = 0 

en un entorno de x<> = 0. Si suponemos que existe una solucion y = 2 flit/ y la 
sustituimos en la ecuacion diferencial, llegamos a la formula de recurrencia 


fl?H-l 


n — n 


n + 1 


Si bien esto nos da una serie de potencias y = 2 aM que formalmente satis- 
face (6.44), el criterio del cociente pone en evidencia que esa serie converge tinica- 
mente para x = 0. Asf pues, no existe serie de potencias solucion de (6.44) valida 
en cualquier intervalo abierto en torno a x 0 = 0. Este ejemplo no contradice el 
teorema 6.13 porque cuando ponemos la ecuacion (6.44) en la forma (6.43) encon- 
tramos que los coeficientes Pi y P 2 vienen dados por 


AM = - 


AM = - -V 

X 2 


y 
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Estas funciones no admiten desarrollo en serie de potencias en torno al origen. 
La dificultad aquf radica en que el coeficiente de y" en (6.44) tlene el valor 0 
cuando x = 0; es decir, la ecuacion diferencial tiene un pun to singular en x = 0. 

Para apreciar las dificultades que se presentan en la investigacion de las 
ecuaciones diferenciales en las proximidades de un punto singular es necesario 
conocer la teorfa de funciones de variable compleja. Sin embargo, algunos casos 
particulares de ecuaciones con puntos singulares pueden tratarse con metodos 
elementales. Por ejemplo, supongamos la ecuacion diferencial (6.43) equivalente 
a una ecuacion de la forma 

(6.45) (x - x 0 ) 2 y" + (x — x 0 )P(x )/ + Q(x)y = 0, 

donde P y Q tienen desarrollos en series de potencias en un cierto intervalo abier- 
to (x<> — r,x 0 + r). En este caso decimos que x 0 es tin punto singular regular de 
la ecuacion. Si dividimos ambos miembros de (6.45) por (x — x (l ) 2 la ecuacion se 
transforma en 


y" + 



Q(x) 

(x - x 0 f 


y = o 


para x ¥* x 0 . Si P(x 0 ) ^0o Q(x 0 ) 0, o si Q(x„) = 0y Q'(x 0 ) ¥= 0, o el coefi¬ 

ciente de y o el de y no tendra desarrollo en serie de potencias en torno al punto 
x 0 , asf que el teorema 6.13 no es aplicable. En 1873 el matematico aleman Jorge 
Frobenius (1849-1917) desarrollo un metodo muy practico para tratar tales ecua¬ 
ciones. Enunciaremos el teorema de Frobenius pero no daremos su demostra- 
cion. (*) En la seccion siguiente damos los detalles de la demostracion para un 
caso particular importante, la ecuacion de Bessel. 

El teorema de Frobenius se desdobla en dos partes, que dependen de la 
naturaleza de las ralces de la ecuacion cuadratica 


(6.46) t(t - 1) + P(x 0 )t + Q(x 0 ) = 0. 

Esta ecuacion cuadratica se llama la ecuacion de indices de la ecuacion diferencial 
dada (6.45). Los coeficientes P(x n ) y Q(x 0 ) son los terminos constantes de los 
desarrollos de P y Q en series de potencias. Sean <*i y las raices de la ecuacion 
de indices. El tipo de solucion que se obtiene por el metodo de Frobenius de- 
pende de si esas rafces difieren o no en un numero entero. 


(*) Para la demostraci6n v£ase E. Hille, Analysis, Vol. II, Blaisdell Publishing Co., 
1966, o E. A. Coddington, An Introduction to Ordinary Differential Equations, Prentice-Hall, 
1961. 
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TEOREMA 6.14. PRIMER CASO DEL TEOREMA DE FROBENIUS. Sean <x x y ot 2 las 
raices de la ecuacion de Indices y supongamos que a x — a 2 no es un entero. En- 
tonces la ecuacion diferencial (6.45) tiene dos soluciones independientes u x y u 2 
de la forma 

(6.47) u x (x) = \x - xX'J, a n (x - x 0 ) n , con a 0 = 1, 

n= 0 

y 

(6.48) u i( x ) = lx- x 0 rib n (x - x o r, con b 0 = 1. 

n—0 

Ambas series convergen en el intervalo \x — x 0 | < r, y la ecuacion diferencial se 
satisface para 0 < \x — x 0 | < r. 

TEOREMA 6.15. SEGUNDO CASO DEL TEOREMA DE FROBENIUS. Sean a x y a 2 
las raices de la ecuacion de indices y supongamos que a x — a 2 = N es un entero 
no negativo. Entonces la ecuacion diferencial (6.45) tiene una solucion u x de la 
forma (6.47) y otra solucion independiente u 2 de la forma 


u lx) = |x - x o r I b n (x - x o y + C u x (x) log |* - x 0 |, 

n —0 


donde b 0 = 1. La constante C no es nula si N = 0. Si N > 0, la constante C 
puede o no ser cero. Como en el caso 1, ambas series convergen en el intervalo 
\x — x 0 | < r, y las soluciones son validas para 0 < |x — x 0 | < r. 

6.25 Ecuacion de Bessel 

En esta seccion utilizamos el metodo sugerido por Frobenius para resolver 
la ecuacion de Bessel 

(6.49) x 2 y" + xy' + (x 2 — a 2 )/ = 0, 

donde a es una constante no negativa. Esta ecuacidn se emplea en problemas rela¬ 
tives a vibraciones de membranas, flujo de calor en cilindros, y propagacion de 
corrientes electricas en conductores cilmdricos. Algunas de sus soluciones se co- 
nocen con el nombre de funciones de Bessel. Tambien se presentan esas funciones 
en Teona de Numeros. La ecuacidn tomo el nombre del astronomo aleman 
F. W. Bessel (1784-1846), si bien ya aparece en las investigaciones de Daniel 
Bernoulli (1732) y de Euler (1764). 

La ecuacidn de Bessel tiene la forma (6.45) con x n = 0, P(x) = 1, y 
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Q(x) = x 2 — a 2 , de modo que el punto x 0 es un punto singular regular. Puesto 
que P y Q son anah'ticas en toda recta real, intentamos encontrar soluciones de 
la forma 

oo 

(6.50) }> = |x|‘2Xx"> 

71 = 0 

con a 0 ^ 0, valida para todo x real con la posible exception de x = 0. 

Primero mantenemos x > 0, de modo que x* — xK La derivacion de (6.50) 
nos da 


= tx* 1 '2,a n x n + x‘2«a n x” 1 = x‘ 1 J,(n + t)a n x n . 

7*=0 71=0 7i=0 


Analogamente, obtenemos 


y" = x‘~ 2 ][(n + t)(n + t - 1 )a n x n . 

71=0 

Si L(y) = x 2 y" + xy' + (x 2 — a 2 )y, encontramos 
L(y) = x*f(n + 0(« + * - 1 )a n x n + x* J](n + t)a n x n 

n=0 n=0 

+ - x*2a l a n x n = x‘2 [(n + 0 2 - «- 2 ]a n x n + x* 20 „x n+ *. 


71=0 


71=0 


Pongamos ahora L(y) = 0, suprimamos x\ e intentemos determinar los Oa de modo 
que el coeficiente de cada potencia de x se anule. Para el termino independiente 
es necesario que (f 2 — a 2 )a a = 0. Como quiera que buscamos una solucion con 
0 O ^ 0, esto exige que 

(6.51) / 2 — a 2 = 0. 

fista es la ecuacidn de Indices. Sus raices a y — a son los unicos valores posibles 
de t que nos pueden dar una solucion del tipo deseado. 

Consideremos primero t = a. Para esta t, las ecuaciones restantes para la 
determination de los coeficientes se transforman en 

(6.52) [(1 + a) 2 - <x 2 K = 0 y [(/i + a) 2 - a 2 ]a„ + a n _ t = 0 

para n^2. Puesto que « 2 0, la primera de esas implica que a, = 0. La segunda 
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formula puede escribirse en la forma 

a n -2 


(6.53) 


^ n 


&71- 


(n + a) 2 — a 2 n(n + 2a) ’ 


con lo que a 3 = a 5 = a 7 — ... = 0. Para los coeficientes con indices pares te- 
nemos 




-a o 

2(2 + 2a) 


y, en general 


__ ~ i* Q _ ~«2 _ (-l) 2 fln 

2 2 (1 + a) ’ 4 4(4 +2a) 2 4 2! (1 + a)(2 + a) ’ 

-«4 = _ ( —1) 3 Uq _ 

6(6 + 2a) 2 6 3! (1 + a)(2 + a)(3 + a) ’ 


_ (- 0 %, _ 

2 2n n! (1 + a)(2 + a) • • • (n + a) 


Por consiguiente, la eleccion t = a nos da la solucion 

y = a„x‘ f 1 + J _ 

\ «=i 2 n! (1 + a)(2 + a) • • • (n + a) 

El criterio del cociente demuestra que la serie de potencias que aparece en esta 
formula converge para todo x real. 

En esta discusion hemos supuesto que x > 0. Si x < 0 podemos repetirla 
reemplazando x* por (— x) 1 . Encontramos nuevamente que t debe satisfacer la 
ecuacion f — a 2 — 0. Haciendo t — a obtenemos la misma solucion, salvo que el 
factor externo x“ queda reemplazado por (—x)\ Por tanto la funcion f a dada por 
la serie 


(6.54) 


/«(*) = a 0 \x\* 




(-l)”x 2 


2 2 ”n! (1 + a)(2 + a) • • • (n + a) 


es una solucion de la ecuacidn de Bessel valida para todo real x ¥= 0. Para los va- 
lores de a para los que existen /^(O) y f"(0), la solucion tambien es valida para 
x = 0. 

Consideremos ahora la rafz t = — a de la ecuacion de indices. Obtenemos en 
lugar de (6.52), las ecuaciones 


((1 - a) 2 - a 2 K = 0 y 


[(n - a) 2 - a 2 ]a„ + a„_ 2 = 0 
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que se convierten en 

(1 — 2a)a 1 = 0 y n(n — 2a)a n + a„_ 2 = 0. 


Si 2 a no es entero esas ecuaciones nos dan a x = 0 y 


n(n — 2a) 

para n ^ 2. Puesto que esta formula de recurrencia es la misma que (6.53), con a 
sustituida por —a, Uegamos a la solucion 


(6.55) 


/-«W = a 0 |x| a 1 + 2 


(-lTx 


2 n 


[ 2 2 "n! (1 - a)(2 - a) • • • (n - a) 


valida para todo real x ¥= 0. 

La solucion /_ a se obtuvo en la hipotesis de que 2a no es un entero positivo. 
No obstante, la serie que da /_ a tiene sentido incluso si 2 a es un entero po¬ 
sitivo, en tanto que a no sea entero positivo. Puede comprobarse que / _ a satisface 
la ecuacion de Bessel para tal valor a. Por consiguiente, para cada tenemos 
la serie solucion / a , dada por (6.54); y si a no es un entero no negativo hemos en- 
contrado otra solucion /_ a dada por (6.55). Las dos soluciones f a y /_ a son inde- 
pendientes, ya que una de ellas oo cuando x -» 0, y la otra no. Seguidamente 
simplificaremos la forma de las soluciones. Para ello necesitamos algunas propieda- 
des de la funcion gamma de Euler que brevemente vamos a recordar. 


Para cada real s > 0 definimos r(s) mediante la integral impropia 

m-j'r'e-'dt. 

Esta integral converge si s > 0 y diverge si s ^ 0. La integracion por partes nos 
conduce a la ecuacion funcional 

(6.56) r(i+l) = ir(i). 

Esto implica que 

ro + 2 ) = (s + i)r(s + i) = (s + i) s r( S ), 

T(j + 3) = (s + 2)r(s + 2) = (s + 2) (s + 1> r(a), 


y, en general 
(6.57) 


T(a + n) = (a + n — 1) • • • (a + l)s T(s) 
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para todo entero positivo n. Puesto que r(l) = e~* dt = 1, cuando ponemos 

s = 1 en (6.57) encontramos 

T(«+ 1) = nl. 

Asf pues, la funcion gamma es una extension de la funcion factorial de los ente- 
ros a los numeros reales positivos. 

La ecuacion funcional (6.56) puede usarse para extender la definicion de 
r(s) a valores negativos de s que no sean enteros. Escribamos (6.56) en la forma 

(6.58) T(s) = - ( - + - 1) . 

s 

El segundo miembro tiene sentido sis + l>0ys#0. Por consiguiente, pode- 
mos usar esa ecuacion para definir r(s) si — 1 < s < 0. El segundo miembro de 
(6.58) tiene ahora sentido si s + 2>0, s¥= —l, s¥^ 0, y podemos usar esa 
ecuacion para definir r(s) para — 2 < s < — 1. Continuando asf, podemos exten¬ 
der la definicion de r(s) por induccion a cualquier intervalo abierto de la forma 
—n < s < —n + 1, donde n es un entero positivo. La ecuacion funcional (6.56) y 
su extension (6.57) son ahora validas para todo real s para el que ambos miem- 
bros tengan sentido. 


Volvamos ahora a la discusion de la ecuacion de Bessel. La serie que da / a 
en la ecuacion (6.54) contiene el producto (1 +«) (2 + «)... (n + «). Podemos 
expresar este producto mediante la funcion gamma tomando s = 1 + a en (6.57). 
Esto nos da 


a + «X2 + «)••• ( B + «)« + «) . 

r(i + «) 


Por consiguiente, si elegimos a 0 = 2'" ct /T(1 + a) en (6.54) y designamos la fun¬ 
cion resultante f a (x) por / a (x) cuando x > 0, la solucion para x > 0 puede escri- 
birse en la forma 


( 6 . 59 ) 


J«(x) = 


(- 1 )" 


2/ t?o n] r (” + 1 + a )U 


La funcion J a definida por esta ecuacidn para r>0y«^0se llama funcidn de 
Bessel de primera especie y de orden a. Cuando a es un entero no negativo, sea 
a — p, la funcion de Bessel J p viene dada por la serie de potencias 


u *)=2 


(-i) B 


S n! (« + P)!\2, 


2fl-f j> 


(p = 0,1,2,...). 
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fista es tambien solucion de la ecuacion de Bessel para x < 0. Se han construido 
tablas de funciones de Bessel. En la figura 6.2 se han dibujado las graficas de las 
dos funciones de Bessel J 0 y J x . 


y 



Figura 6.2 Grdficas de las funciones de Bessel Jo y J \. 


Podemos definir una nueva funcidn /_ a reemplazando « por —a en la 
ecuacion (6.59), si a es tal que T(n + 1 — a) tiene sentido; esto es, si a no es un 
entero positivo. Por consiguiente, si x > 0 y a > 0, a # 1,2,3,..., definimos 


J~a(x) = 


y (- 1 )" /x? n 
l 2 / n • r(n + 1 — a)\2/ ' 


Tomando s = 1 — a en (6.57) obtenemos 


r(n + 1 - a) = (1 - a) (2 -«)••■(»- a) T(1 - a) 


y vemos que la serie que da /_ a (x) es la misma que la de /_ a (x) de la ecuacion 
(6.55) con a 0 = 2“/r(l — a), x > 0. Por lo tanto, si « no es entero positivo, /_ a 
es una solucion de la ecuacion de Bessel para x > 0. 

Si a no es entero, las dos soluciones /<* (x) y J_ a (x) son linealmente indepen- 
dientes en el eje real positivo (puesto que su cociente no es constante) y la solucion 
general de la ecuacion de Bessel para x > 0 es 

y “b <-2 • 

Si a es un entero no negativo, sea a = p, hemos encontrado unicamente la 
solucion J p y sus productos por constantes validos para x > 0. Otra solucion, 
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independiente de esta, puede encontrarse por el metodo descrito en el ejercicio 4 
de la seccion 6.16. fiste establece que si u x es una solucion de y"+P- l y'+P' i y—0 
que nunca se anula en un intervalo /, una segunda solucion u 2 independiente de 
Ui viene dada por la integral 

u 2 (x) — u x (x) f ■ dt , 

donde Q(x) = e-! p i (x)ax . Para la ecuacidn de Bessel tenemos P x (x) = \/x, asi 
que 0(x) = 1/x y una segunda solucion u 2 viene dada por la formula 

( 6 . 60 ) 

si c y x pertenecen al intervalo / en el que J p no se anula. 

Esta segunda solucion puede ponerse en otras formas. Por ejemplo, a partir 
de (6.59) podemos escribir 


[J P (t)T gp(th 

donde g p (0) 0. En el intervalo / la funci6n g p tiene un desarrollo en serie de 

potencias 

00 

gj>(0 = 2 A rd n 

71=0 

que podrfa determinarse igualando coeficientes en la identidad g P (t)[J P (t)Y = t 2p . 
Si suponemos la existencia de tal desarrollo, el integrando de (6.60) toma la forma 


1 


1 

t 2p+1 


QO 

2 a »*"- 


Integrando esta formula termino a termino entre c y x obtenemos un termino loga- 
rftmico A 2P log x (de la potencia i -1 ) mas una serie de la forma x~ 2p 2 B„x n . 
Por consiguiente, (6.60) toma la forma 


u 2 (x) = A 2v J v (x) log x + J„(x)x _2l, 2 B n x n . 

71=0 

Puede demostrarse que el coeficiente A 2p ¥=■ 0. Si multiplicamos Mj(x) por 1 /A 2p la 
solucion que resulta se designa con K p (x) y tiene la forma 

K,Jx) = J v (x) log x + x~’2C n x n . 

n=0 
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Esta es la forma de la solution anunciada en el segundo caso del teorema de 
Frobenius. 

Habiendo llegado a esta formula, podemos comprobar que existe realmente 
una solucion de esta forma sustituyendo en el segundo miembro de la ecuacion 
de Bessel y determinando los coeficientes C n de modo que la ecuacion se satisfaga. 
Los detalles de este calculo son largos y seran omitidos. El resultado final puede 
expresarse asf 


K v (x) = J P (x) log x 


1 M- V (P - n - 1)1 (x^ 1 M’Yf-i v h » + *»+. Af 

2 I 2 ) ^ n! \2/ 2\2 )£ n!(n + p)!l2/ ’ 


donde ft 0 = Oyft re =l + 2 + .- . + 1 /n para n ^ 1. La serie del segundo miem¬ 
bro converge para todo real x. La funcion K p definida para x>0 por esa formula se 
llama funcion de Bessel de segunda especie y de orden p. Puesto que K„ no es el 
producto de una constante por J p , la solucion general de la ecuacidn de Bessel en 
este caso para x > 0 es 


y = c i J v( x ) + c 2 K 7 ) (x) . 

En los ejercicios que siguen se discutiran otras propiedades de las funciones de 
Bessel. 

6.24 Ejercicios 


1. a) Sean / una solucion cualquiera de la ecuacion de .Bessel de orden a y g(x) = *%/(*) 
para x > 0. Demostrar que g satisface la ecuacidn diferencial 


y" + 1 + 


1 -4« 2 \ 
4x 2 


)y~ 0 . 


b) Cuando 4a 2 = 1 la ecuacion diferencial del apartado a) se transforms en y" + y = 0; 
su solucidn general es y = A cos x + B sen x. Utilizar esa information y la igualdad (*) 
T(|) — Vit para demostrar que, para x > 0, 


1 

2 \Vf 


/ 

2 \W 

•W = (; 

— I sen x 
ttXJ 

y 

2-uW = (- 

— ) COS X 
rrXJ 


(*) El cambio de variable t = u* nos da 

l (i) = f t-'Ae-t dt — 2 [ e-u 2 du = Vn 
^ 0 + Jo 

(En el ejercicio 16 de la seccidn 11.28 puede verse una demostracidn de que 

2 J 0 °° e-u 2 du = Vn.) 
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c) A partir de las series que dan J\ A (x) y / _i^ (x), deducir directamente las formulas 
del apartado b). 

2. Utilizar la representaci6n en series de potencias de las funciones de Bessel para demos- 
trar que 

, d 

a) dx {X ° J * {x)) 

d 

b) ~dx iW. 

3. Sean FJ.X) — x*JJ,x) y G a (x) = x~ a JJ.x) para x > 0. Obs6rvese que cada cero positivo 
de / a es un cero de F x y tambien lo es de G x . Con el teorema de Rolle y el ejercicio 2 
demostrar que los ceros de J a y /«+1 se intercalan. Esto es, existe un cero de J x entre 
cada par de ceros positivos de J x+ i, y un cero de J x+ 1 entre cada par de ceros posi¬ 
tives de / a . (Ver figura 6.2.) 


4. 


5. 


a) A partir de las relaciones del ejercicio 2 deducir las relaciones de recurrencia 

- J a(x) +J x (x) =J x _ 1 (x) y -/„(*) -J'tix) = J x+1 (x). 

b) Con las relaciones del apartado a) deducir las fdrmulas 

*«-iW + 4tiW = j 4(x) y j a _ i(x) - y I+1 (x) = 2/,;(x). 

Utilizar el ejercicio 1 b) y una fdrmula de recurrencia adecuada para demostrar que 


A<(*) = 



— COS X 


)• 


Hallar una fdrmula andloga para /_^(x), Observacidn: /„(x) es una furicidn elemental 
para todo a que sea la mitad de un entero impar. 

6. Demostrar que 


\ T x ^ J? +1 (x) 

y 

^ (xJ x (x)J a+1 (x)) = x(J%(x) - /f +1 (x)). 

7. a) Usar las identidades del ejercicio 6 para demostrar que 


/’(*) + 2 £ /*(*)- 1 y 2 (2« + DJ»(x)Jn + i(x) = t* • 

n=l n=0 

b) Del apartado a) deducir que |/ 0 (x)| Sly |/„(x)| <, \ para n = 1,2,3,..., y 
todo x > 0. 
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8. Sea gj- x ) = x^fY^) para x > 0, donde a y b son constantes no nulas. Demostrar que 
g a satisfacp 'a ecuacion diferencial 

xy + (a ! iV + i - o?b 2 )y = 0 

si, y s61o si, fx es una solucidn de la ecuacidn de Bessel de orden a. 

9. Hacer uso del ejercicio 8 para expresar la solucidn general de cada una de las ecuacio- 
nes diferenciales siguientes por medio de las funciones de Bessel para x > 0. 

a) y" + xy = 0. c) y" + x m y = 0. 

b) y" + x 2 y = 0. d) y?y" + (x 4 + j)y = 0. 

10. Generalizar el ejercicio 8 cuando f, y ^ se relacionan mediante la ecuacidn 
gx(x) = x c f x (ax b ) para x > 0. Hallar entonces la solucidn general de las siguientes 
ecuaciones por medio de las funciones de Bessel para x > 0. 

a) xy" + 6/ + y = 0. c) xy" + 6y' + x*y = 0. 

b) xy" + 6y' + xy — 0. d) x?y" — xy + (x + l)y — 0. 

11. Dada la identidad de la forma 

Ji(x) -J 0 (x) = aJ"(x), 

donde aye son constantes. Determinar aye. 

12. Encontrar una serie de potencias solucidn de la ecuaci6n diferencial xy" + y' + y — 0 
convergente para — <» < x < + °o. Demostrar que para x > 0 puede expresarse median¬ 
te una funcion de Bessel. 

13. Consideremos una ecuacidn diferencial lineal de segundo orden de la forma 

x 2 A(x)y" + xP(x)y’ + Q(x)y = 0, 

en la que A(x), P(x>, y Q(x) admiten desarrollos en series de potencias, 

■< (x) = 2 a kX k , P(x) = ^ pY, Q(x) = 2 qkX k , 

k=0 k=0 4=0 

con 5 ^ 0, convergente cada una en un intervalo abierto (— r, r). Si la ecuacidn dife¬ 
rencial tiene una serie soluci6n de la forma 

y 

n =0 

valida para 0 < x < r, demostrar que t satisface una ecuaci6n cuadratica de la forma 
t 2 + bt + c = 0, y determinar b y c en funcion de los coeficientes de las series de 
A(x), P(x) y Q(x). 

14. Considerar un caso particular del ejercicio 13 en el que .AOc) = 1 — x, P(x) — | y 
Q(x) = — \x. Hallar una serie solucidn con t no entero. 

15. La ecuaci6n diferencial 2x 1 y” +(x l — x)y’ + y = 0 tiene dos sohiciones independientes 
de la forma 

y 

n=0 
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valida para x > 0. Determinar esas soluciones. 

16. La ecuacion diferencial no lineal y" + y + ay 2 = 0 es «ligeramente» no lineal si - a es una 
constante pequena no nula. Supongamos que existe una solucion que puede expresarse 
como serie de potencias de a de la forma 

00 

y = 2 « n W a " (valido en un cierto intervalo 0 <a<r) 

n=0 

y que esta solucion satisfaga las condiciones iniciales y = 1 e y' = 0 cuando x = 0. 
Para ajustarse a esas condiciones iniciales, intentamos elegir los coeficientes u„(x) de 
modo que « 0 (0) = 1 ,k'( 0)= 0 y u„(0) =u’ n (0) = 0 para n > 1. Sustituir esa serie en la 
ecuacion diferencial, igualar las potencias adecuadas de a y determinar con ello u»(x) 
y ui(x). 
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SISTEMAS DE ECUACIONES DIFEREN Cl ALES 


7.1 Introduction 

Aunque el estudio de las ecuaciones diferenciales comenzo en el siglo xvii, 
no fue hasta el xix que los matematicos se dieron cuenta que un numero relativa- 
mente pequeno de ecuaciones diferenciales podia resolverse con medios elemen- 
tales. Los trabajos de Cauchy, Liouville y otros, mostraron la importancia de 
establecer teoremas generales para garantizar la existencia de soluciones para 
ciertas clases especiales de ecuaciones diferenciales. El capitulo 6 se dedico al 
empleo de un teorema de existencia y unicidad en el estudio de las ecuaciones 
diferenciales lineales. En este capitulo nos interesarpos en una demostracion de 
ese teorema y en temas relacionados con el. 

La teoria de existencia para ecuaciones diferenciales de orden superior puede 
reducirse al caso de primer orden introduciendo sistemas de ecuaciones. Por ejem- 
plo, la ecuacion de segundo orden 

(7.1) y" + 2ty’-y = e t 

puede transformarse en un sistema de dos ecuaciones de primer orden introdu¬ 
ciendo dos funciones incognitas e y 2 . siendo 

yi- y, y 2 = yl ■ 

Tenemos entonces /<,= /' = y", asi que (7.1) puede escribirse como un sistema 
de dos ecuaciones de primer orden: 

yi = y 2 

(7.2) 

y 2 = y 1 - 2 ty 2 + e*. 

No podemos resolver las ecuaciones separadamente con los metodos del capitulo 6 
porque cada una de ellas contiene dos funciones incognitas. 
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En este capitulo consideramos sistemas que constan de n ecuaciones dife¬ 
renciales lineales de primer orden con n funciones incognitas y 1 ,,y n . Esos 
sistemas tienen la forma 


yi — Pu(t)yi + Pu(t)y 2 + • • • + p in (t)y n + q x (t) 

(7.3) 


y'n = P„l(0Pl + P„ 2 (t)y 2 + • • • + Pnn(t)y n + <7 n (0 • 


Las funciones p,* y q t que aparecen en (7.3) se consideran funciones dadas defini- 
das en un cierto intervalo /. Las funciones y t ,..., y„ son las funciones incognitas 
que hay que determinar. Los sistemas de este tipo se llaman sistemas lineales de 
primer orden. En general cada ecuacion del sistema contiene mas de una funcion 
incognita por lo cual las ecuaciones no pueden resolverse separadamente. 

Una ecuacion diferencial lineal de orden n siempre puede transformarse en 
un sistema. Supongamos que la ecuacion de orden n dada es 

(7.4) /"> + + • • • + a n y = R(t), 

donde los coeficientes a ; son funciones dadas. Para transformarla en un sistema 
escribimos y x = y e introducimos una nueva funcion incognita para cada una de 
las sucesivas derivadas de y. Esto es, ponemos 

Pi = y > P2 = y'\ > P3 = y't , ■ ■ •, y„ = y'n~ 1, 

y escribimos (7.4) como sistema 

y[ = Pa 

P 2 = Ps 


(7.5) 


y'n-1 = Pr, 

y'n = -«nPl - fln-lP 2 -^iPn + *(0 • 


La discusion de los sistemas puede simplificarse considerablemente mediante 
la notacion matricial y vectorial. Consideremos el sistema general (7.3) e intro- 
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duzcamos las funciones vectoriales Y = (y, ,..., y„), Q = (q x ,..., q„), y una 
funcion matricial P = [p, ; ], definidas por las ecuaciones 


no = (yi(o, • • • > jn(0), geo = (</i(o. •.., ?,,(0) , no = moi 

para cada t de /. Consideremos los vectores como matrices columna nXl y es 
cribamos el sistema (7.3) en la forma mas sencilla 


(7-6) Y'= P(t)Y + Q(t). 

Por ejemplo, en el sistema (7.2) tenemos 


Y = 


_P2j 

En el sistema (7.5) tenemos 


P(t) = 


0 1 ‘ 
1 —2 1 


0(0 = 





“ 0 

1 

0 

■ 0 ~ 


“ 0 " 


Ji 


0 

0 

l 

• 0 


0 


72 








Y = 

• 

, no = 

0 

0 

0 

• - 1 

to 

II 

0 





^n— 1 

^n—2 

• -a x _ 




Un problema de valores iniciales para el sistema (7.6) es el de encontrar una 
funcion vectorial Y que satisfaga (7.6) y tambien una condicion inicial de la 
forma Y(a) = B, donde a e J y B = (b t ,..., b n ) es un vector M-dimensional 
dado. 

En el caso n = 1 (el caso escalar) sabemos segun el teorema 6.1 que, si 
P y Q son cominuas en ], todas las soluciones de (7.6) vienen dadas por la formula 

(7.7) Y(x) = e Mx> Y(a) + e A(x) f x e~ AW Q(t) dt, 

•la 

donde A(x) = J* P{t) dt, y a es un punto cualquiera de /. Demostraremos que 
esta formula puede generalizarse en forma adecuada para sistemas, esto es, cuando 
P(t) es una funcion matricial nXn y Q(t) una funcion vectorial de dimension n. 
Para ello tenemos que asignar un significado a las integrales de matrices y a las 
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exponenciales de matrices. Por consiguiente, vamos a comentar brevemente el 
calculo con funciones matriciales. 

7.2 Calculo con funciones matriciales 

La generalizacion de los conceptos de integral y derivada para funciones 
matriciales es completamente correcta. Si P(t) = [p„(t)], definimos la integral 
Ja P(t) dt por 


Pm dt 

*> a 



Esto es, la integral de la matriz P(t) es la matriz obtenida integrando cada elemen- 
to de P(t), suponiendo como es natural, que cada elemento sea integrable er 
[a, b]. El lector puede comprobar que la linealidad para las integrates se genera- 
liza a las funciones matriciales. 

La continuidad y derivabilidad de funciones matriciales se definen tambien 
en funcion de los elementos. Decimos que una funcion matricial P = Ip, 7 ] es 
continua en t si cada elemento p,,- es continuo en t. La derivada P' se define deri- 
vando cada elemento 


m = [pm, 

siempre que existan todas las derivadas p'ij(t). Se comprueban facilmente las re- 
glas de derivacion basicas para sumas y productos. Por ejemplo, si P y Q son 
funciones matriciales derivables, tenemos 

(P + Q)’ =P'+Q' 

si P y Q son del mismo tamano, y si el producto PQ esta definido, tenemos tambten 

(- PQ)' = PQ' + P'Q 

La regia de la cadena tambien es valida. Esto es, si F(f) = P[g(t)], donde P es 
una funcion matricial derivable y g es una funcion escalar derivable, entonces 
F(f) = g’(t)P’[g(t)]. El teorema de la derivada nula, y el primer y segundo teore- 
mas fundamentales del calculo tambien son validos para funciones matriciales. 
Las demostraciones de esas propiedades se proponen en el proximo conjunto de 
ejercicios. 

La definicion de la exponencial de una matriz no es tan sencilla y exige mas 
preparacion. Tal concepto se expone en la seccion que sigue. 
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7.3 Series de matrices. Normas de matrices 

Sea A = [a, 7 ] una matriz nX« de elementos reales o complejos. Queremos 
definir la exponencial e 1 de manera que posea alguna de las propiedades funda- 
mentales de la exponencial ordinaria de valores reales o complejos. En particular, 
exigiremos la ley de exponentes en la forma 

(7.8) e tA e sA = e u+s)A para todo par s y t reales, 
y la relacion 

(7.9) e° — I, 

donde O e I son las matrices, nXn, cero e identidad respectivamente. Puede pa- 
recer natural definir e A como la matriz [e' ,n ]. No obstante, eso no es aceptable 
porque no satisface ninguna de las propiedades (7.8) o (7.9). En lugar de ello, 
definiremos e' por medio de un desarrollo en serie de potencias, 


0 ° Ak 

e A =y — 
*=o k\ 


Sabemos que esta formula es valida si A es un numero real o complejo, y demos- 
traremos que se satisfacen las propiedades (7.8) y (7.9) si A es una matriz. Antes 
necesitamos conocer que se entiende por serie convergente de matrices. 

DEFINICION DE SERIE CONVERGENTE DE MATRICES. Dada Ulia SUCesidtl {C*} 
de matrices mXti cuyos elementos son numeros reales o complejos, designemos el 
elemento ij de Ck por cjp Si todas las mn series 

(7.10) 2c'f (i = 1,. . ., m\j = 1,. . ., n) 

1 

son convergentes, decimos entonces que la serie de matrices 2^=1 Ck es conver¬ 
gente, y su suma esta definida como la matriz mXn cuyo elemento ij es la serie 

(7.10) . 

Un sencillo y util criterio de convergencia de una serie de matrices puede 
darse en funcion de la norma de una matriz, generalizacion del valor absoluto 
de un numero. 

definici6n de norma de una matriz. Si A = [fl„] es una matriz mxn 
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de elementos reales o complejos, la norma de A, designada por \\A\\, se define 
como el numero no negativo dado por la formula 

m n 

(7.11) MII = ZS>«I. 

<=1 3=1 

Es decir, la norma de A es la suma de los valores absolutos de todos sus 
elementos. Algunas veces se usan otras definiciones de la norma, pero hemos 
elegido esta debido a la facilidad eon la que podemos demostrar las propiedades 
siguientes. 

TEOREMA 7.1. PROPIEDADES FUNDAMENTALES DE LAS NORMAS. Para las 
matrices rectangulares A y B, y todos los escalares c reales o complejos tenemos 


\\A + £11 < Mil + Mil, M*ll < Mil Mil. IIM|| = |c| Mil• 

Demostracion. Solamente probamos el resultado para \\AB'\, suponiendo que 
A es m X n y B es n X p. Las demostraciones de los otros son sencillas y las deja- 
mos como ejercicios. 

Escribiendo A — [a,k~},B = [&*/],| tenemos AB = [ 2Li &ikbkj], asf que de 
(7.11) obtenemos 


MB || =21 

2 = 1 J=1 


2 ^ik^kj 
k =1 


<II\a ik \l\b kj \< 

2 — 1 fc=l 7 = 1 


A.- 

i= k= 1 


l\aj ||B|| = Mil IIB|| ■ 


Observese que en el caso especial B = A la destgualdad para ||i4B|| se con- 
vierte en ||A 2 || ^ '\A\\ 2 . Por induccion tambien tenemos 

M fc ll < Mil* para *=1,2,3,.... 


Estas desigualdades se usaran en la discusion de la exponencial de una matriz. 

El teorema que sigue nos da una util condicion suficiente para la convergen- 
cia de una serie de matrices. 

TEOREMA 7.2. CRITERIO DE CONVERGENCIA PARA SERIES DE MATRICES. Si 
{C k } es una' sucesion de matrices mXn tales que ||C*|| converge, entonces 
la serie de matrices C k tambien converge. 

Demostracion. Designemos el elemento ij de C* por c <*>. Puesto que 
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\c\f\ < IIQH, la convergence de ||CJ implica la convergencia absoluta de 
cada una de las series c'f . Luego cada una de las series c j^ es conver- 
gente, por lo que la serie de matrices Q es convergente. 

7.4 Ejercicios 

1. Comprobar que la linealidad de integrates tambien es valida para las integrales de fun- 
ciones matriciales. 

2. Comprobar cada una de las siguientes reglas de derivation para funciones matriciales, 
suponiendo que P y Q son derivables. En a), P y Q deben ser del mismo tamano de ma- 
nera que P + Q tenga sentido. En b) y d) no deben ser necesariamente del mismo 
tamano con tal que los productos tengan sentido. En c) y d), Q se supone no singular. 

a) C P + QY =P' + Q'. c) (2- 1 )' = -Qr'Q'Qr 1 . 

b) (PQY = PQ' + PQ . d) (P£> -1 )' = -PQ 'Q'Q 1 + P'Q'. 

3. a) Sea P una funcion matricial derivable. Demostrar que las derivadas de P 2 y P 1 
vienen dadas por las formulas 

(P 2 )' = PP’ + P’P, (P 3 )' = P 2 P' + PP'P + P'P 2 . 

b) Enunciar una formula general para la derivada de P k y demostrarla por induccion. 

4. Sean P una funcion matricial derivable y g una funcion escalar derivable cuyo recorrido 
sea un subconjunto del dominio de P. Definir la funcion compuesta F(t) = P[g(t)] y 
demostrar la regia de la cadena, F'(t) = g'(0F'[g(t)]. 

5. Demostrar el teorema de la derivada nula para funciones matriciales: Si P’(t) = O para 
todo t en un intervalo abierto (a, b), la funcion matricial P es constante en ( a, b). 

6. Establecer y demostrar generalizaciones del primero y segundo teoremas fundamentals 
del calculo para funciones matriciales. 

7. Establecer y demostrar una formula de integracion por partes en la que los integrandos 
sean funciones matriciales. 

8. Demostrar las propiedades siguientes de las normas matriciales: 

\\A +B\\ < MU + Mil, Mil = |c| Mil. 

9. Si una funcion matricial P es integrable en un intervalo [a,b] demostrar que 

|[fV(o<*|| ^ P mmdt. 


10. Sea D una matriz diagonal nXn, D = diag (X, ,... ,X„). Demostrar que la serie matricial 
converge y es tambien una matriz diagonal. 


V D k 

2-,k\ = diag > • • • > < " i ") • 

k=0 


(El termino correspondiente a k = 0 se sobreentiende que es la matriz identidad I.) 
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11. Sea D una matriz diagonal tiXn, D = diag (X t ,. .., X„). Si la serie matrieial ^ (| c k D' 
converge, demostrar que 

2 CkD k = diag (f c k X\,. .. , f c k X k \ . 

0 \k =0 k=0 / 

12. Supongamos que la serie matrieial Q. converge, donde cada C t es una matriz nxn. 

Demostrar que la serie matrieial V=°_ ( AC k B) tambien converge y que su suma es la 
matriz k ~ 1 

Aqul A y B son matrices tales que los productos AC k B tienen sentido. 


7.5 Exponencial de una matriz 

Aplicando el teorema 7.2 es facil demostrar que la serie matrieial 


(7.12) 


oo 

2 

0 


4! 

k\ 


converge para cualquier matriz cuadrada A con elementos reales o complejos. 
(Se sobreentiende que el termino correspondiente a k = 0 es la matriz identi- 
dad I.) La norma de cada uno de los terminos satisface la desigualdad 


4 ! 

k\ 


< Mil* 
“ kl 


Puesto que la serie J cP/kl converge para todo numero real a, el teorema 7.2 
implica que la serie (7.12) converge para toda matriz cuadrada A. 


definici6n DE exponencial de una matriz. Dada una matriz cualquiera 
A, nXn, con elementos reales o complejos definimos la exponencial e A como la 
matriz nXn dada por la serie convergente (7.12). Esto es, 




A k 


ft k'- 

Jc=0 


Observese que esta definicion implica e°'= /, donde O es la matriz cero. Con 
la ayuda de las ecuaciones diferenciales se estudiaran otras propiedades de la 
exponencial. 
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7.6 Ecuacion diferencial que se satisface por e tA 

Sean t un numero real, A una matriz nXn y E{t) la matriz nXn dada por 

E(t) = e tA . 

Mantendremos A fijo y estudiaremos esa matriz como una funcidn de t. Obtenemos 
primero una ecuacion diferencial a la que satisfaga E. 

teorema 7.3. Para todo real t la funcion matricial E definida por E(t) = e tA 
satisface la ecuacion diferencial matricial 


E'(t) = E(t)A = AE(t). 

Demostracion. De la definicion de la exponencial de una matriz tenemos 




ifc=0 



t k A k 

kl 


Designemos con c el elemento ij de A k . Entonces el elemento ij de t k A k /k\ es 
t k cl k) /k\. Luego, de la definicion de serie matricial, tenemos 


(7.13) 




kl 


Vi! ctt , 


Cada elemento del segundo miembro en (7.13) es una serie de potencias en t, con- 
vergente para todo t y viene dada por la serie derivada 


2 


let*- 1 

kl 



_ „<fc+i> 

kl a 


Esto demuestra que existe la derivada E'{t) y viene dada por la serie matricial 


£'(0 = 2 

k=0 


t k A k+1 

kl 




A = E(t)A. 


En la ultima ecuacion utilizamos la propiedad de que A k+1 = A k A. Puesto que A 
es permutable con A k podrfamos tambien escribir A kA1 — AA k para obtener la 
relacion £'(t) = AE(t). Esto completa la demostracion. 


Observacidn: La demostracion anterior pone tambien en evidencia que A es 
permutable con e ,A . 
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7.7 Teorema de unicidad para la ecuacion diferencial matricial F'(t) = AF(t) 

En esta section demostramos un teorema de unicidad que caracteriza todas 
las soluciones de la ecuacion diferencial matricial F'(t) = AF(t). La demostracion 
utiliza el teorema siguiente. 

teorema 7.4. no singularidad de e tA . Cualesquiera que sean la matriz A, 
nXn, y el escalar t tenemos 

(7.14) e tA e -tA = I 

Luego e tA es no singular, y su inversa es e~ tA . 

Demostracion. Sea F la funcion matricial definida para todo numero real t 
mediante la ecuacion 


F(t) = e tA e~ tA . 

Demostraremos que F(f) es la matriz identidad / haciendo ver que la derivada 
F'(0 es la matriz cero. Derivando F como un producto, y recordando el resultado 
del teorema 7.3, encontramos 


F'(0 = e tA (e-‘ A y + (e tA )'e~ tA = e tA (-Ae iA ) + Ae tA e~ tA 
— —Ae tJ e tA + Ae tA e~ tA = O , 

puesto que A es permutable con e tA . Por consiguiente, segun el teorema de la 
derivada nula, F es una matriz constante. Pero F(0) = e 0A e 0A — I, por lo cual 
F(t) = I para todo t. Esto demuestra (7.14). 

teorema 7.5. teorema de unicidad. Sean A y B dos matrices constantes 
nXn dadas. La unica funcion matricial F, nXn, que satisface el problema de 
valor inicial 


F'{t) = AF{t ), F(0) = B 

para — < t < + °° es 

(7.15) F(t) = e tA B. 

Demostracion. Observemos primero que e tA B es una solucion. Sea ahora F 
una solucion cualquiera y consideremos la funcion matricial 

G(t) = e-‘ A F(t). 
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Derivando este producto obtenemos 

G\i) = e~ tA F\i) - Ae~ tA F(t) = e~ tA AF(i) - e~* A AF(t) = O. 

Por consiguiente G(t) es una matriz constante, 

G(t ) = G( 0) = jF(0) = B. 

Es decir, e~ tA F{t) = B. Multiplicando por e tA y aplicando (7.14) obtenemos (7.15). 

Observacidn: El mismo tipo de demostracidn hace ver que F(t) = Be ,A es la 
unica solucion del problems de valor inicial 

F'(t) = F(/)A, F( 0 ) = B. 


7.8 Ley de exponentes para exponenciales de matrices 

La ley de exponentes e A e B = e A+B no siempre es valida para exponenciales de 
matrices. En el ejercicio 13 de la seccion 7.12 se da un contraejemplo. No obstante, 
no es dificil demostrar que la formula es valida para matrices permutables. 

teorema 7.6. Sean A y B dos matrices nXn permutables, AB = BA. Te- 
nemos 

(7.16) e A+B = e A e B . 

Demostracion. De la ecuacion AB = BA deducimos que 

A 2 B = A(BA) = (AB)A = {BA)A = BA 2 , 

de modo que B es permutable con A 2 . Por inducci6n, B es permutable con cual- 
quier potencia de A. Escribiendo e IA en forma de serie de potencias encontramos 
que B tambien es permutable con e tA para todo t real. 

Sea ahora F la funcion matricial definida por la ecuacion 

F(t ) = e UA+B> - e tA e tB . 

Derivando F(t) y teniendo en cuenta que B es permutable con e tA encontramos 

F'(t) = (A + B)e UA+m - Ae tA e w - e tA Be tB 

= (A + B)e t{A+B) - (A + B)e tA v tB = (A + B)F(t ). 
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Segun el teorema de unicidad tenemos 

F(t) = e tu+m F( 0). 

Pero F(0) = O, asi que Fit) = O para todo t. Luego 

e «A+B) _ e 'A e tB 

Cuando t = 1 obtenemos (7.16). 

ejemplo. Las matrices sA y tA son permutables para todos los escalares 
s y t. Luego tenemos 


g s AgtA _ e U+t)A 


7.9 Teoremas de existencia y unicidad para sistemas lineales homogeneos con 
coeficientes constantes 

La ecuacion diferencial vectorial 7'(0 = AYit), donde A es una matriz 
constante n X n e Y es una funcion vectorial n-dimensional (considerada como una 
matriz columna n X 1) se denomina sistema lineal homogeneo con coeficientes 
constantes. Utilizaremos la exponencial de una matriz para dar una formula expli- 
cita de la solucion de un tal sistema. 

teorema 7.7. Sean A una matriz constante nXn dada y B un vector n-di- 
mensional. El problema de valor inicial 

(7.17) Y\t) = A 7(0, 7(0) = B , 

tiene solucion unica en el intervalo — °° < / < + oo. Esta solucion viene dada 
por la formula 

(7.18) 7(0 = e tA B. 

Mas general, la unica solucion del problema de valor inicial 

Y'it) = AYit), 7(a) = B, 


es Y(t) = e (t ~ a)A B. 


Demostracion. La derivacion de (7.18) nos da 7'(0 = Ae tA B = AY it). Pues- 
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to que Y(0) = B, esta es una solucion del problema de valor inicial (7.17). 

Para demostrar que es la unica solucion, razonamos como en la demostracion 
del teorema 7.5. Sea Z(t) otra funcion vectorial que satisfaga Z'(t) = AZ(t) con 
Z(0) = B, y pongamos G(t) = e~ tA Z(t). Comprobamos entonces con facilidad que 
G f (t) = O, asi que G(t) = G(0) = Z(0) = B. Es decir, e~ tA Z(t) = B, de modo 
que Z(t) — e tA B = Y(t). Del mismo modo se puede discutir el caso mas general 
con valor inicial Y(a) — B. 

7.10 El problema de calcular e ,A 

Aunque el teorema 7.7 da una formula explfcita para la solucion de un siste- 
na homogeneo con coeficientes constantes, queda todavia el problema de calcular 
efectivamente la exponencial e tA . Si se tratara de calcular e tA directamente a 
partir de la definition de serie tendriamos que calcular todas las potencias A k 
para k = 0, 1, 2,..., y calcular luego la suma de cada serie t k c$ } /k\, donde 
c If es el elemento ij de A h . En general ese es un trabajo desesperante salvo si A 
es una matriz cuyas potencias pueden calcularse facilmente. Por ejemplo, si 
A es una matriz diagonal, sea 

A = diag(A 1 ,...,4), 

entonces toda potencia de A tambien es una matriz diagonal, pues 


A k = diag(Af,. . ., A*). 

Por consiguiente en este caso e tA es una matriz diagonal dada por 


e tA = diag • • • . = dia 8 ^ • • • > e Un )- 


Otro caso facil de manejar es cuando A es una matriz que puede diagona- 
nizarse. Por ejemplo, si existe una no singular C tal que C~\4C es una matriz dia¬ 
gonal, sea C~ l AC = D, entonces tenemos A = CDC~ X , a partir de la cual encon- 
tramos 


A 2 = (CDC-'XCDC- 1 ) = CD 2 C ~ X , 


y, mas general, 


A k = CD k C~ x . 
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Por tanto en este caso tenemos 


JA 




Aqui la dificultad esta en determinar C y su inversa. Una vez esas son conocidas, 
e tA se calcula con facilidad. Naturalmente, no toda matriz puede diagonalizarse 
de modo que la utilidad de las observaciones precedentes es limitada. 

[5 41 

ejemplo 1. Calcular e A para la matriz 2x2, A = 

|_1 2 . 

Solution. Esta matriz tiene autovalores distintos = 6, X 2 = 1, asi que 

a b~ 
c d 


existe una matriz no singular C = 
"6 0 


D = diag (A 1; A 2 ) = 


0 1 


tal que C _ MC = D, donde 
. Para determinar C podemos escribir AC — CD, o 


p 41 

-1 

£3- 


"a b~\ 

[6 0-1 

fN 

_I 

L c d_ 


_1 

1 

o 

t—‘ 

1_ 


Multiplicando las matrices, encontramos que esa ecuacion se satisface cualesquiera 
que sean los escalares a, b, c, d tales que a = 4c, b = —d. Tomando c = d = 1 
elegimos 


Por lo tanto 



'4 -l' 

, c - 1 = - 

1 

l" 

c = 





.1 1. 

5 

.-1 

4. 


e tA = Ce w C~ 1 = 


4 -1 
.1 1 . 


1 1 

LO e*J L—1 4. 


1 

'4 

-f 

" e 6t 

e u 

_ 1 

4e 6t + e* 4e 61 — 4e‘ 

5 

.1 

1. 

_-e* 

4e‘. 

~ 5 

_ e 8< — e* e et + 4e t . 


ejemplo 2. Resolver el sistema lineal 

y'i = 5yi + 4 y 2 
y'i — yi + 2y 2 

sujeto a las condiciones iniciales y t (0) = 2, y 2 (0) = 3. 
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Solution. En forma matricial el sistema se puede escribir asi: 


Y'(t) = A Y(t), 7(0) = 


donde A = 


5 4" 
1 2 


Segun el teorema 7.7 la solucidn es Y(t) = e <A Y(0). Usando la matriz e tA calcula- 
da en el ejemplo 1 encontramos 


yi 

1 

~4e 6i + e* 

r — 

tj - 

1 

<0 

'2 

->’ 2 - 

11 

L/i 1 

. e st - e f 

e u + 4e* J 

.3 


de la que obtenemos 

y x = 4e 6i — 2e‘, y 2 = e 6t + 2e*. 

Se conocen muchos metodos para calcular e ,A cuando A no puede diagona- 
lizarse. La mayori'a de ellos son mas bien complicados y exigen transformaciones 
matriciales previas, cuya naturaleza depende de las multiplicidades de los auto- 
valores de A. Mas adelante discutiremos un metodo practico y seguro para calcular 
e tA que se puede utilizar tanto si A puede diagonalizarse como si no. Es valido 
para todas las matrices A y no exige transformaciones previas de ningun tipo. 
Tal metodo fue desarrollado por E. J. Putzer en un articulo del American 
Mathematical Monthly, Vol. 73 (1966), pags. 2-7. Se basa en un famoso teorema 
atribuido a Arthur Cayley (1821 -1895) y William Rowan Hamilton (1805-1865; 
que establece que toda matriz cuadrada satisface su ecuacion caracteristica. De- 
mostraremos primero el teorema de Cayley-Hamilton y luego lo aplicaremos para 
obtener la formula de Putzer para calcular e tA . 

7.11 Teorema de Cayley-Hamilton 

teorema 7.8. teorema de cayley-hamilton. Sean A una matriz nXn y 

(7.19) /M = det {XI - A) = X n + c^X"- 1 + • • • + c t X + c 0 

su polinomio caracterlstico. Entonces j{A) = O. Es decir, A satisface la ecuacion 

(7.20) A n + c^A”- 1 + ■ ■ • + Cl A + c 0 7 = O. 

Demostracion. La demostracion se basa en el teorema 3.12 que establece 
que para toda matriz cuadrada A se tiene 


(7.21) 


A (cofA)' = (det A)I. 
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Apliquemos esta formula reemplazando A por XI — A. Puesto que det (XI — A) = 
= /( X), la ecuacion (7.21) se convierte en 

(7.22) (XI - v4){cof (XI - A)}* = f(X)I. 

Esta ecuacion es valida para todo real A. La idea de la demostracion consiste en 
hacer ver que tambien es valida cuando A se reemplaza por A. 

Los elementos de la matriz cof (XI — A) son los cofactores de XI — A. Excep- 
to para un factor ± 1, cada uno de tales cofactores es el determinante de una 
menor de A I — A de orden n — 1. Por lo tanto cada elemento de cof (XI — A), 
y por tanto de {cof (XI — A)}', es un polinomio en A de grado <. n — 1. Por 
consiguiente 


{cof (XI - A)}* =\x k B k , 

k=0 

donde cada coeficiente Bk es una matriz nXn con elementos escalares. Aplicando 
esto en (7.22) obtenemos la relacion 

(7.23) (2/ - A)fx k B k =/(A)/ 

k =0 

que se puede poner en la forma 

(7.24) + 2^(8^ - AB k ) - AB 0 = X n I + %X k c k I + c 0 I. 

*=1 k=l 

Igualando ahora los coeficientes de las potencias semejantes de A en (7.24) obte¬ 
nemos las ecuaciones 


B n -1 = I 

B n -i ■dB n _ 1 = c n _ x l 


(7.25) 


B 0 - AB i = Cl I 
—AB 0 = c 0 I. 


La igualacion de los coeficientes es posible porque (7.24) es equivalente a n 2 
ecuaciones escalares, en cada una de las cuales podemos igualar los coeficientes 
de potencias semejantes de A. Multipliquemos a continuacion las ecuaciones (7.25) 
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sucesivamente por A", A" A, I y sumemos los resultados. Los terminos del 

primer miembro desaparecen y obtenemos 

0 = A n + c n _i^4 n_1 + ■■■ + Cl A + c 0 I. 
lo cual demuestra el teorema de Cayley-Hamilton. 

Observation: Hamilton demostro el teorema en 1853 para un tipo especial de 
matrices. Pocos anos mas tarde, Cayley anuncio que el teorema era valido para 
todas las matrices, pero no dio la demostracid" 


ejemplo. La matriz A 


'5 4 0‘ 
1 2 0 
1 2 2 


tiene como polinomio caracteristico 


/(A) = (2 - 1)(A - 2)(A — 6) = A 3 — 9A 2 + 20A - 12. 


El teorema de Cayley-Hamilton establece que A satisface la ecuacion 
(7.26) A 3 - 9^4 2 + 20,4 -12 1=0. 

Esta ecuacion puede usarse para expresar A 3 y todas las potencias superiores de 
A en funcion de /, A y A 2 . Por ejemplo, tenemos 

A 3 = 9A 3 - 20^4 + 12/, 

A 1 = 9A 3 - 20 A 2 + 12 A = 9 (9A 2 - 20 A + 12/) - 20^ 2 + 12yl 
= 6 1A 2 - 168^4 + 108/. 

Tambien se puede emplear para expresar A~ x como un polinomio en A. De (7.26) 
resulta tambien A(A 2 — 9A + 20 1) = 12/, y obtenemos 

A- 1 = h(A 2 -9A + 20/). 


7.12 Ejercicios 


En cada uno de los ejercicios del 1 al 4, a) expresar A~‘, A 1 y todas las potencias supe- 
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riores de A como combinaciones lineales de / y A. (El teorema de Cayley-Hamilton puede 
servir de ayuda). b) Calcular e' A . 


1. A = 


5 . a) Si A 


01 r 1 °i r° i"i r-i o' 

2. A = 3. A « 4. A — 

1 J L 1 2 J L 1 °J L 0 1 

0 1 r cos t sen t 

— , demostrar que e tA = 

_ — 1 Oj — sen t cos t 


a b 

b) Hallar la f 6 rmula correspondiente para e tA cuando A = , a, b reales. 

—b a 


6 . Si F(t) 


~t t - \ 
~ 0 1 


demostrar que e F ’ <() = eF(e t ~ 1 ). 


7. Si A(t) es una funcion escalar de t, la derivada de e A{,) es ^"A'^t). Calcular la derivada 

n r\ 


de e"‘ > cuando A(t)= y demostrar que el resultado no es igual a ninguno de los 

_° OJ 

dos productos e 41 " A\t ) o A'(t)e Al ‘' 1 . 

En cada uno de los ejercicios 8 , 9, 10, a) calcular A ", y expresar A 3 en funcidn de 
I, A, A 1 , b) Calcular e' A . 


0 1 1 


0 0 OJ 
TO -1 O' 


0 1 1 


8 . A = 0 0 1 . 9. A = 0 1 1 . 10. A = 0 1 0 . 


0 0 0 


2 0 O' 


0 1 1 


11. Si ^4 — 1 0 1 ,expresar e tA como combinacion lineal de I, A, A 2 . 

0 1 0 



‘0 1 01 

"x 2 

xy 

f 

12. Si A = 

2 0 2 demostrar que e A = 

2 xy 

x 2 + y 2 

2 xy 


0 ! oj 


xy 

x 2 _ 


y = senh 1 . 


13. Este ejemplo demuestra que la ecuacidn e A+B — e A e B no siempre es vdlida para las 
exponenciales de matrices. Calcular cada una de las matrices e A e B , e B e A . e A+B cuando 
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A = 


'1 r 
0 0 


y 




, y observar que los tres resultados son distintos. 


7.13 Metodo de Putzer para calcular e ,A 

El teorema de Cayley-Hamilton demuestra que la potencia n-esima de cual- 
quier matriz A, nXn, puede expresarse como combinacion lineal de las potencias 
inferiores I, A, A 2 , ■ • • ,A n ~~ 1 . De aqui' resulta que cada una de las potencias su- 
periores A n+1 , A n+2 ,.. ., tambien puede expresarse como combinacion lineal de 
I, A, A 2 ,. . ., A n 1 . Por lo tanto, en la serie que define e' \ cada termino t k A k /k\ 

con k 2; n es una combinacion lineal de t k I, t k A, t k A 2 . t k A"~'. Luego cabe pen- 

sar que e tA puede expresarse como un polinomio en A de la forma 

( 7 . 27 ) e’ A = £ q k m k , 

k = 0 

donde los coeficientes escalares qAt) dependen de t. Putzer dcsarrollo dos metodos 
utiles para expresar e M como un polinomio en A. El teorema que sigue describe 
el mas sencillo de los dos metodos. 

teorema 7.9. Sean Ai,... ,X n los autovalores de una matriz A, nXn, y 
definamos una sucesion de polinomios en A como sigue: 

( 7 . 28 ) P 0 (A) = I, P k (A) = f\( A ~ IJ), Para k = l,2,...,n. 

m=l 

Tenemos entonces 

(7 29 ) etA = 2 r k i i(t)P k (A), 

V ' ’ Jfc=0 


donde los coeficientes escalares r t (t) . r„(t) se determinan por recurrencia a 

partir del sistema de ecuaciones diferenciales lineales. 

(? 3Q) 0 = ^i'-i(t), r x (0) = 1, 

r k+i(t) = ^*+i r *+i(0 "E r k( 0> r fc+i(0) = 0, (k = 1, 2,. . ., n — 1). 

Observation: La ecuacion (7.29) no expresa e" directamente en potencias 
de A como indica (7.27), sino como una combinacion lineal de los polinomios 
P<,(A ), P,(A ),..., P„ i(A). Estos polinomios se calculan facilmente en cuanto se 
han determinado los autovalores de A. Asimismo son de facil calculo los multipli- 
cadores r,(t),..., r„(t) de (7.30). Aunque esto exige resolver un sistema de ecuacio- 
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nes diferenciales lineales, el sistema que nos ocupa tiene una matriz triangular y 
las soluciones pueden determinarse en forma sucesiva. 


Demostracion. Sean n(t),. .. ,r„(t ) las funciones escalares determinadas por 

(7.30) y defmamos una funcion matricial F por induction 

(7.31) F(t) = fr k+1 (t)P k (A). 

k =0 


Observese que F(0) = ri(0 )P 0 (A) = I. Demostraremos que F(0 = e IA probando 
que F satisface la misma ecuacion diferencial que e tA , es decir, F'(0 = AF(t). 
Derivando (7.31) y usando las formulas de recurrencia (7.30) obtenemos 

FV) =Ki(W = iW) + h + ir k+ MP k (A), 

k =0 Ar=0 

donde r u (t) es por definition 0. Volvemos a escribir esa formula en la forma 
F'(t) =ir k+1 «)P k+ M) + 2 X k+1 r k+1 (t)P k (A), 

k=0 k =0 

restamos luego X n F(t) — X n r kn (t)P k (A) para obtener la relation 

(7.32) F'(t) - X n F(t) = Zr k+1 (t){P k+ i(A) + (4+i ~ X n )P k (A)}. 

k =o 

Pero de (7.28) vemos que P k +AA) — (A — A* + iI)P k (A), por lo que 

F k+ M) + (4+i - 4 )PM) = (A- X k+1 I)P k (A) + ( 4 +1 - X n )P k (A) 

= (A~ KWM). 

Por consiguiente la ecuacion (7.32) se convierte en 

F'(0 - X n F(t) = (A- Xjif r k+1 (t)P k (A ) = (A - Xj){F(t) - r n (t)F n _ 1 (^)} 

k=0 

= (A- X n I)F(t)-r n (t)P n (A). 

El teorema de Cayley-Hamilton implica que P„(A) = O, asf que la ultima ecua¬ 
cion se convierte en 


F\t) - X n F(t) = (A - XJ)F(t) = AF(t) - X n F(t), 
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de la que resulta F’(t) = AF(i). Puesto que F(0) = /, el teorema de unicidad (7.7) 
demuestra que F(t) = e tA . 

eiemplo 1. Expresar e tA como combination lineal de / y de A si A es una 
matriz 2x2 con sus autovalores iguales a A. 

Solution. Poniendo A, = A 2 = A, tenemos que resolver el sistema de ecua- 
ciones diferenciales 


ri(0 = Ar^f), rj(0) = 1, 

r'iit) = Ar 2 (t) + r x (f), r 2 ( 0) = 0. 

Resolviendo esas ecuaciones de primer orden en forma sucesiva encontramos 


ri(t) = e xt , r 2 (f) = te u . 


Puesto que P 0 (A) — I y PAA) = A — A/, la formula pedida para e tA es 
(7.33) e tA = e u I + te u (A - A/) = e xt (l - At)/ + te u A . 


ejemplo 2. Resolver el ejemplo 1 si los autovalores de A son Ay ju t tales 
que A p. 

Solution. En este caso el sistema de ecuaciones diferenciales es 

r[(t) = Ar,(/), r x (0) = 1, 

r&t) = pr.lt) + r x (t), r 2 (0) = 0. 

Sus soluciones vienen dadas por 

.. 

tiU) = e. r 2 (t) = —-. 

A — p 


Puesto que PAA) = I y PAA) = A — A/ la formula pedida para e tA es 


(7.34) 


e tA = e xt L + 




2p^ / p^ — p^ 

(,4-A/) = -- ^-1 + ~ - —A. 

A — p A — p A — p 


Si los autovalores A y /i son numeros complejos, las exponenciales e xt y e lil 
tambien lo seran. Pero si A y /* son complejos conjugados las expresiones que mul- 
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tiplican / y A en (7.34) seran reales. Por ejemplo, supongamos 
2 = a + //?, [j, = a — //?, (1 # 0. 

Entonces A — /x = 2 i/3 asi que la ecuacion (7.34) se transforma en 

pia+ifDt Aa—ip)t 

e tA = + -—^- [4 - (* + ifii] 

2 iP 

= ( + t ~2W~ (A ~ a/ “ iW ) 

= e a j(cos fit + / sen fit)l + (4 - a/ _ jW. 

Los terminos que contienen i desaparecen y queda 


(7.35) 


M = — 




{(/? cos fit — a sen /5t)7 + sen fit 4}. 


7.14 Otros metodos para calcular e ,A en casos especiales 

El metodo de Putzer para expresar e tA como un polinomio en A es completa- 
mente general debido a que es valido para todas las matrices cuadradas A. Un 
metodo general no siempre es el mas sencillo en ciertos casos particulares. En esta 
seccion damos metodos mas sencillos para calcular e tA en tres casos especiales: 
a) Cuando todos los autovalores de A son iguales, b) cuando todos los autovalores 
de A son distintos, y c) cuando A tiene dos autovalores distintos y uno de ellos 
precisamente de multiplicidad 1. 

teorema 7.10. Si A es una matriz nXn con todos sus autovalores iguales 
a A, entonces tenemos 

n—1 k 

(7.36) e tA = e^-j-(A~Uf. 

*=o ' c - 

Demostracion. Puesto que las matrices A tl y t(A — XI) son permutables 
tenemos 
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El teorema de Cayley-Hamilton implica que (/l — A/) fe = O para todo k ^ n, asi' 
que el teorema queda demostrado. 

teorema 7.11. Si A es una matriz nXn con n autovalores distintos 
A t , A 2 , ..., An, entonces tenemos 

e tA = 2 e Uk L k (A), 

k=l 

donde Lk(A) es un polinomio de grado n — 1 dado por la formula 

4(A) = TT f- pa™ k — 1, 2, n . 

i*k k 1 

Observacidn: Los polinomios L k (A) se llaman coeficientes de interpolacidn de 
Lagrange. 

Demostracion. Definamos una funcion matricial F por la ecuacion 

(7.37) F(t)=f e ^L k (A) 

k—1 

y comprobemos que F satisface la ecuacion diferencial F’(t) = AF(t) y la condi- 
cion inicial F(0) = I. De (7.37) vemos que 

AF(t) - F\i) = fe tu (A - KI)LM)- 

k =1 

Segun el teorema de Cayley-Hamilton tenemos (A — A kI)Lk(A) = O para cada k, 
de modo que F satisface la ecuacion diferencial F(t) = AF(t). 

Para completar la demostracion necesitamos probar que F satisface la con- 
dicion inicial F(0) = I, que se convierte en 

(7.38) 14(A) = /. 

k= 1 

En el ejercicio 16 de la seccion 7.15 se esboza una demostracion de (7.38). 

El teorema que sigue trata el caso en el que A tiene dos autovalores distin¬ 
tos, uno de los cuales tiene precisamente multiplicidad 1. 

teorema 7.12. Sea A una matriz n'Xn ( n > 3) con dos autovalores distin¬ 
tos A y p, tales que A tiene multiplicidad n — 1 y p. tiene multiplicidad 1. Tenemos 
entonces 
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M = e -2^( A -nf + 

0 


put 


iti - *)" 




y_ 

Id 


Demostracion. Como en el caso del teorema 7.10 empezamos escribiendo 


QQ^ w—2 oo ^ 

e tA = e u^_ (A _ U)k ==e u^L {A _ U)k + e u 2 L {A _ U)* 


k =0 

f7i—l+r 

w+e “ 2 «- w 


\n— 1+r 


Calculemos ahora en forma finita la serie con fndice r del segundo termino del se- 
gundo miembro mediante el teorema de Cayley-Hamilton. Puesto que 


A — pi — A — XI — (p — X)I 

encontramos 

(A - Xl)-\A - pi) = (A- Xiy -(p- X)(A - XI)- 1 . 


El primer miembro es O en virtud del teorema de Cayley-Hamilton asx que 
(A - XI) n = (p - X)(A - XI )- 1 . 

Usando esta relacion reiteradamente llegamos a 


(A - XI)— 1+r = (p- X) r (A - XI)— 1 . 
Por consiguiente la serie con fndice r se convierte en 


V' ; re - 1+r 1 y 

2 ^ - ur "' “ W - w : 




=-2 j-y - ^ - u r-'- 


(p - xy 


k\ 


Esto completa la demostracion. 


La formula explfcita del teorema 7.12 puede deducirse tambien aplicando el 
metodo de Putzer, pero los detalles son mas complicados. 

Las formulas explfcitas de los teoremas 7.10, 7.11 y 7.12 sirven para todas 
las matrices de orden n 3. Puesto que el caso 3X3 es frecuente en la practica, 
resumimos a continuation las formulas para mayor facilidad en su utilization. 



Otros metodos para calcular e tA 

CASO I. Si una matriz A, 3X3, tiene autovalores A, A, A, entonces 


259 


e iA = e u {I + t(A - XI) + \t\A - XI) 2 }. 

CASO II. Si una matriz A, 3X3, tiene autovalores A, p, v, entonces 

e tA = e u (A - pI)(A - vl) glIt (A - XI)(A - vl) e , t (A - XI)(A - pi) 

(X — p)(X — v) (p — X)(p — v) (v — X)(v — p) 

CASO III. Si una matriz A, 3X3, tiene autovalores A, A, p, siendo 
X¥=p, entonces 

= e u {I + t(A - XI)} + (A - XI f - (A — XI) 2 . 

(fl — A.) p — X 


EJEMPLO. 


Calcular e tA cuando A = 


'0 

0 

2 


1 

0 

-5 


O' 

1 

4 


Solucidn. Los autovalores de A son 1, 1, 2, asi que la fdrmula deljcasojlll 
nos da 


(7.39) e M = e\I + /(A - I)} + (e 2t - e‘)(A - I) 2 - te\A - If. 

Haciendo operaciones y ordenando obtenemos 

(7.40) , e tA = (—2/e 4 + e 24 )/ + {(3/ + 2)e f - 2e 24 }A - {(/ + l) c 4 _ f'jA 2 . 

Ahora ya podemos calcular (A — If o A 2 y efectuar las operaciones indicadas 
en (7.39) o (7.40) para escribir el resultado como una matriz 3X3. 


—2/e 4 + e 24 


e 


tA _ 


—2 (/ + l)e 4 + 2e 24 
—2 (/ + 2)e 4 + 4e 24 


(3/ + 2)e 4 - 2e 24 
(3/ + 5)e 4 - 4e 24 
(3/ + 8)e 4 - 8e 24 


-(/ + l)e 4 + e 24 ' 
-(/ + 2)e 4 + 2e 2( 
— (/ + 4)e 4 + 4e 24 _ 
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7.15 Ejercicios 


Para cada una de las matrices de los ejercicios 1 al 6, expresar e M como un polinomio 
en A. 


—1 
<-* 

1 

to 


f 1 21 


NJ 

II 


l-H 

l 

Tf | 


K) 


3. A = 


1 0 2 
0 1 3 
0 0 1 










"1 

1 

0 

O' 

0 

1 

o" 


*3 

-1 

f 


0 

2 

1 

0 

0 

0 

1 

5. A — 

2 

0 

1 

6. A — 

0 

0 

3 

0 

-6 

-11 

-6 


1 

-1 

2 








" 






.0 

0 

0 

4_ 


7. a) Se sabe que una matriz A, 3x3, tiene todos sus autovalores iguales a X. Demos- 
trar que 


e tA = .^{(A 2,2 _ 2At + 2)1 + {-2Xt 2 + 2t)A + t 2 A 2 }. 


b) Encontrar una formula analoga si A es una matriz 4x4 con todos sus autovalores 
iguales a X. 

En cada uno de los ejercicios del 8 al 15, resolver el sistema Y' = AY sujeto a la con- 
dicion inicial dada. 



'1 2' 

I 1 

>r 


1 

1 

Ui 


r 

8. A = 

2 -1_ 

II 

z - *\ 

- C 2j 

9. A = 

_ —!5 1 _ 

E(0) = 

J. 



'3 

-1 

r 


f 

10. A = 

2 

0 

i 

| 

II 

-1 


1 

-1 

2 


2 



0 

1 

o" 


V 

12. /4 = 

0 

0 

1 

, no) = 

0 


-6 

-11 

-6 


_o 


'i 

1 

0 

O' 


'O' 

0 

2 

1 

0 

, E(0) = 

0 

0 

0 

3 

0 

1 

0 

0 

0 

4_ 


_1. 



"2 

0 

o' 


Cl 

11. A = 

0 

1 

0 

, Y( 0) = 

c 2 


0 

1 

1 


- C 3_ 



"-2 

2 

-3' 


Y 

13. A = 

2 

1 

-6 

II 

o 

S' 

0 


-1 

-2 

0 


0 


'0 

0 

2 

O' 


T 

l 

0 

0 

2 

3 

O 

II 

0 

0 

0 

0 

4 

2 

_o 

0 

1 

0. 


.1 


14. A = 
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16. Este ejercicio esboza una demostraci6n de la ecuacidn (7.38) utilizada en la demostracidn 
del teorema 7.11. Sea L t (\) el polinomio en X de grado n — 1 definido mediante 


» A - A, 

= IT rnr 

1=1 A k A j 
i*k 

donde X,,..., X- son n escalares distintos, 

a) Demostrar que 


L k (K) 


0 si Aj- it X k , 

,1 si A t - = A*. 


b) Sean yi,..., y«, n escalares arbitrarios, y sea 


/>(A) = 'iy k L k ().). 

k=\ 


Demostrar que p(X) es el unico polinomio de grado < n — 1 que satisface las n ecua- 
ciones 


P(h) = y k P ara k = 1,2,... ,n. 

c) Demostrar que^" =1 LiX\) = 1 para todo X, y deducir,que para toda matriz cuadrada 
A tenemos 


lLk(A)~I, 

k =1 


donde I es la matriz identidad. 


7.16 Sistemas lineales no homogeneos con coeficientes constantes 

A continuacion consideramos el problema de valor inicial no homogeneo 

(7.41) HO = A 7(0 + 2(0, Y{a) = B, 

en un intervalo /. A es una matriz constante nXn, Q es una funcion vectorial 
n-dimensional (considerado como una matriz n X 1) continua en /, y a es un 
punto dado en /. Podemos obtener una formula explicita para la solucion de este 
problema siguiendo el mismo proceso que en el caso escalar. 
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Multiplicands primero ambos miembros de (7.41) por la exponencial matri- 
cial e~ tA y pongamos la ecuacion diferencial en la forma 

(7.42) e~ u {Y'(t) - AY(t)} = e~ ,A Q{t). 

El primer miembro de (7.42) es la ucuvada del producto e~ tA Y(t). Por consi- 
guiente, si integramos ambos miembros de (7.42) entre a y x, donde x e /, ob- 
tenemos 


e xA Y( x ) - e ' lJ Y(a) = j‘ e - tA Q(t) dt. 

Multiplicando por ef eA obtenemos la formula explfcita (7.43) que aparece en el 
teorema siguiente. 

teorema 7.13. Sean A una matriz constante nXny Q una funcion vectorial 
n-dimensional continua en un intervalo J. Entonces el problema de valor inicial 

Y'(t) = AY(t)+Q(t), Y(a) = B, 
tiene una solucion iinica en I dada por la formula explicita 
(7.43) Y(x) = e u - a)A B + e xA \* e~ tA Q(t) dt. 

* a 

Como en el caso homogeneo, la dificultad al aplicar esta formula en los casos 
practicos radica eh el calculo de las exponenciales de matrices. 

Observese que el primer termino, e (x - a)A B, es la solucion del problema ho¬ 
mogeneo Y\t) = AY(t), Y(c^ = B. El segundo termino es la solucion del pro¬ 
blema no homogeneo 


Y'(t) = AY(t)+ Q(t) , y(a) = O. 

Ilustramos el teorema 7.13 con un ejemplo. 

EfEMPLO. Resolver el problema de valor inicial 


Y'(t) = AY(t)+Q(t), Y(0) = B, 
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en el intervalo (—<»,+ <»), donde 



‘2 

-1 

r 


’ e 2t ~ 


'0' 

A = 

0 

3 

-l 

to 

*•>>*. 

ii 

0 

, 5 = 

0 


2 

1 

3, 


je 2t _ 


0. 


Solution. De acuerdo con el teorema 7.13, la solucion viene dada por 
(7.44) Y(x) = e xA j“ e~ tA Q(t) dt = J’ e (x ~ t)A Q(t) dt. 

Los autovalores de A son 2, 2 y 4. Para calcular e xA utilizamos la formula del 
caso III, section 7.14, obteniendo 

e xA = e 2x {I + x(A - 21)} + &e ix - e 2x )(A - 21 f - \xti\A - 2If 
= e 2x {I' + x(A - 21) + \{e 2x -lx - 1)(^4 - 2 If}. 

Podemos reemplazar x por x — t en esta formula para obtener e (x ~ t)A . Por con- 
siguiente el integrando en (7.44) es 

e u-t)AQ( { ) = + ( x - t)(A - 21) + - 2(x - t) - l](^t - 2I) 2 }Q(t) 


T 


’ x — t " 

+ -(4 - 2I) 2 e 2x 
4 

- _ 2 (x - o - r 

0 

+ (A- 2 l)e 2x 

0 

0 



■X* - 0- 


_e 2a 7<r 2< - 2;(x — t) — t_ 


Integrando, encontramos 


[X 

X 


lx 2 ' 

e (x ~ t)A Q(t) dt = e 2x 

0 

+ (4 - 2I)e 2x 

0 

J o 

i* 2 - 


_ix 3 _ 


Puesto que tenemos 


+ - (A - 2lfe 2x 
4 


\e 2x — \ — x — x 2 
0 

V* _ i _ 1 Y _ l v 2 _ 1 y 3 



» 

1 

o 


" 2 0 2‘ 

II 

<N 

1 

0 1 -1 

y (A - 2/) 2 = 

-2 0 -2 


2 1 1 


2 0 2_ 



264 


Sistemas de ecuaciones diferenciales 


encontramos 



’ x 1 


r iy 3 1 


|e 2x — § — lx — lx 2 — \x*- 

Y(x) = e ix 

0 

+ e 2x 

__ 1 v 3 

6 X 

+ e* 

-fe 2 * + | + lx + lx 2 + }x 3 


J* 2 _ 


_x 2 + 


le 21 - | - lx - lx 2 - ix\ 


_ e . 


$e 2x -l + ix- lx 2 ' 
-le 2x + | + lx + lx 2 
fe 2 * - f - 1* + lx\ 


Las filas de esta matriz son las funcicnes pedidas y u y 2 , y 3 - 

7.17 Ejercicios 

1. Sea Z una solucidn del sistema no homog<5neo 

Z\t) = AZ(t) + Q(t), 

en un intervalo / con valor inicial Z(a). Demostrar que existe una sola solucidn del 
sistema homogeneo 


Y\t) = A Y(t) + Q(i) 

en / con valor inicial Y(a) y que viene dado por la fdrmula 
Y(t) = Z(t) + Y{a) - Z(a )}. 

A menudo se dispone de otros mdtodos para determinar una solucidn particular 
Z(f) que asemeja a la funcidn dada Q(t). Los ejercicios 2, 3, 5, y 7 indican tales m6- 
todos para O(t) = C , Q(t) —e at C, Q(t) = f“C, y Q(f) = (cos at)C + (sen at)D, donde 
C y D son vectores constantes. Si la solucidn particular as! obtenida Z(t) no tiene el 
valor inicial pedido, modificamos Z(f) como se indica en el ejercicio 1 para obtener otra 
solution Y(t) con el valor inicial exigido. 

2. a) Sea A una matriz constante nxn, B y C sean vectores constantes n-dimensionales. 
Demostrar que la solution del sistema 

Y\t) = A Y(t) + C, Y{a)=B, 

en (— oo, + oo) viene dada por la fdrmula 


Y{x) = e (x ~ a)A B + (fj “e uA dujC. 
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b) Si A es no singular, demostrar que la integral del apartado a) tiene el valor 

{g(x-a)A _ I}A-\ 

c) Calcular Y(x) en forma explfcita cuando 



r-i 2i 


r 1 ! 


~b 

A = 

i 

m 

(N 

1 

_l 

, c = 

A 

, B = 

c 


3. Sean A una matriz constante nxn, y B y C vectores constantes n-dimensionales, y sea a 
un escalar dado. 

a) Demostrar que el sistema no homogeneo Z'(t) = AZ(t) + e at C tiene una solucion 
de la forma Z(t) — e «tB si, y solo si, ( al — A)B = C . 

b) Si a no es un autovalor de A, demostrar que el vector B siempre se puede elegir 
de modo que el sistema del apartado a) tenga una solucion de la forma Z(t) = e at B . 

c) Si a no es un autovalor de A, demostrar que toda solucion del sistema 
Y'(t) = A Y(t) + e xt C tiene la forma Y(t) = e tA (Y( 0) - B) + e xt B, donde B = (olI — 
- AY'C. 

4. Utilizar el metodo sugerido por el ejercicio 3 para hallar una solucion del sistema no 
homogeneo Y'(t) = A Y(t) + e Lt C con 



r 3 ii 


'-l* 

A = 

i 

r4 

_i 

, c = 

-i_ 


Y(0) = 


0 

1 


5. Sean A una matriz constante nXn, B y C vectores constantes n-dimensionales, y m 
un entero positivo. 

a) Demostrar que el sistema no homogeneo Y’(t ) = AY(t) + t m C, y(0). = B, tiene una 
solucion particular de la forma 


Y(t) — B 0 + tB 1 + t 2 B 2 + • ■ • + t m B m , 
en donde B a ,B l ,...,B m son vectores constantes, si y s61o si 


C = ~—,A m+ 1 B. 
m\ 

Determinar los coeficientes B 0 ,Bi,,B„ para una tal solucion. 

b) Si A es no singular, demostrar que el vector inicial B siempre puede elegirse de ma- 
nera que el sistema del apartado a) tenga una solucion de la forma indicada. 

6. Considerese el sistema no homogeneo 

X = 3^ +y 2 +t 3 
X = 2j! + 2y 2 + f®. 

a) Encontrar una solucion particular de la forma Y(t) = So + <Bi + EB 2 + fB, . 

b) Encontrar una solucion del sistema con la condicion y,(0) = y 2 (0) = 1 . 

7. Sean A una matriz constante nxn, B,C,D vectores constantes n-dimensionales y a un 
numero real no nulo dado. Demostrar que el sistema no homogeneo 


Y\t) = A Y(t) + (cos <x/)C + (sen <xt)D , Y(0) = B, 



266 


Sistemas de ecuaciones diferenciales 


tiene una solution particular de la forma 

7(f) = (cos a t)E + (sen a t)F, 
siendo E y F vectores constantes, si y s61o si 


( A 2 + a H)B = —(AC + <xD). 


Determinar E y F en funcion de A,B,C para una tal solucion. Observese que si 
A 2 + a 2 I es no singular, el vector, inicial B siempre se puede elegir de modo que el sis- 
tema tenga una solucion de la forma indicada. 

8 . a) Hallar una solucion particular del sistema no homogeneo 


y[ - yi + 3y 2 + 4 sen 2t 

y'i =Ji ~yi- 


b) Hallar una solucion del sistema con las condiciones yi(0) = y 2 (0) = 1 . 


En cada uno de los ejercicios 9 al 12, resolver el sistema no homogeneo 
Y'(t) — AY(t) + Q(t) sujeto a la condition inicial indicada. 


4 r 


' 0 ' 


T 

2 1_ 

to 

II 

t 

, 7(0) = 



_-2e_ 


0 


10. A 




n o> = 


Cl 

C 2. 


11. A = 

'-5 -1* 

, Q0) = 

1 

r- 

fN 

1 

r- 

, 7(0) = 

r 1007-1 
“ 442 


2 — 3_ 


L-3ti + 12J 


7 07 
221 _ 



"-1 

-1 

o" 


'f 


6 * 

12. A = 

0 

-1 

-1 

, Q(t) = 

it 

, 7(0) = 

-2 


0 

0 

-1_ 


t_ 


! 


7,18 Sistema lineal general Y\t ) = P(t)Y(t) + Q(t ) 

El teorema 7.13 da una formula explicita para la solucion del sistema lineal 


Y'{t) = AY{t)+ Q{t), Y(a) = B, 
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donde A es una matriz constante nXn y Q(t), Y(t) son matrices columna nXl. 
Volvemos ahora al caso mas general 

(7.45) no =m no + m, m = b , 

en donde la matriz P(t), nXn, no es necesariamente constante. 

Si P y Q son continuas en un intervalo abierto /, un teorema general de exis¬ 
tence y unicidad que demostraremos mas adelante nos dice que para cada a de / 
y cada vector inicial B existe una sola solucion para el problema de valor inicial 

(7.45) . En esta seccion utilizamos este resultado para obtener una formula para 
la solucion, que generaliza el teorema 7.13. 

En el caso escalar (n = 1) la ecuacion diferencial (7.45) puede resolverse 
del modo siguiente. Sea A(x) = J* P(t)dt, multipliquemos entonces ambos miembros 
de (7.45) por e~ A(t) poniendo la ecuacion diferencial en la forma 

(7.46) e~ Mt) { Y'(t) - P(t ) y(f)} = e~ AU) Q(t). 

El primer miembro es la derivada del producto e~~ A{t) Y(t). Por consiguiente, po- 
demos integrar ambos miembros entre a y x, siendo a y x puntos de /, y obte- 
nemos 


e~ Mx) Y(x ) - e~ A(tt) Y(a) = f“ e~ Mt) Q(t) dt. 

J a 

Multiplicando por e A(x) se llega a la formula explicita 


(7.47) Y(x) = e Aix) e~ AM Y(a) + e A(x) J* e~ AW Q(t ) dt. 

La unica parte de este razonamiento que no es aplicable a las funciones ma- 
triciales es la afirmacion de que el primer miembro de (7.46) es la derivada del 
producto e~ A(ty Y{t). En este punto utilizamos el hecho de que la derivada de 
e - A (t) es —P(t)e- A(t) . En el caso escalar esto es una consecuencia de la formula 
siguiente para la derivacion de las funciones exponenciales 


Si E(t) = e Mt) , entonces £'(0 = A'(t)e AM . 


Desgraciadamente, esta formula de derivacion no siempre es valida cuando A es 
una funcion matricial. Por ejemplo, es falsa para la funcion matricial 2x2 


A(t) = 


1 t 
0 0 


(Ver ejercicio 7 de la seccion 7.12). Por tanto es necesario una 
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modification del razonamiento para extender la ecuacion (7.47) al caso de las 
matrices. 

Supongamos que multiplicamos cada miembro de (7.45) por una matriz 
F(t), nXn, no especificada. Esto nos da la relation 

F(t)Y'(t) = F(t)P(t)Y(t) + F(t)Q(t). 

Sumemos ahora a los dos miembros F'(t)Y(t) con la idea de transformar el primer 
miembro en la derivada del producto F(t)Y(t). Si hacemos esto, la ultima ecua- 
cion nos da 


{F(t)Y(t) v = (E'(0 + F(t)P(t)}Y(t) + F(t)Q(t). 

Si podemos elegir la matriz F(t) de manera que la suma {F'(0 + F(t)P(t)} del se- 
gundo miembro sea la matriz cero, la ultima ecuacion se simplifica y queda 

{F(0n0}' = F(t)Q(t). 

Integrando esta desde a ax obtenemos 

F(x)Y(x) - F(a)Y(a) = j" F(t)Q(t) dt. 

•>a 

Si, ademas, la matriz F(x) es no singular, obtenemos la formula explicita 
(7.48) y(x) = F{xT l F{a) Y(a) + F(x)" 1 f“ F(t)Q(t) dt. 

da 

Esta es una generalizacion de la formula escalar (7.47). El proceso funcionara 
bien si podemos encontrar una funcion matricial F(t), nXn, que satisfaga la ecua- 
cion diferencial matricial 


nO = ~F(t)P(t) 


y que no sea singular. 

Observese que esta ecuacion diferencial es muy parecida a la ecuacion dife¬ 
rencial original (7.45) con Q(t) = 0, salvo que la funcion incognita F(t) es una 
matriz cuadrada en lugar de una matriz columna. Asimismo, la funcidn incognita 
esta multiplicada a la derecha por —P(t) en lugar de estarlo a la izquierda por 
p (t). 

Seguidamente demostraremos que la ecuacion diferencial para F siempre 
tiene una solution no singular. La demostracion dependera del siguiente teorema 
de existencia para sistemas lineales homogeneos. 
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teorema 7.14. Supongamos que Alt) es una funcidn matricial nXn con- 
tinua en un intervalo abierto J. Si a e J y B es un vector n-dimensional dado, el 
sistema lineal homogeneo 

Y'(t) = A(t)Y(t), Y(a) = B, 

tiene en J una solucion Y que es un vector n-dimensional 

En la section 7.21 damos una demostracion de este teorema. Con la ayuda 
de este podemos demostrar el siguiente. 

teorema 7.15. Dada una funcidn matricial P, nXn, continua en un inter¬ 
valo abierto J, y dado un punto cualquiera a en J, existe una funcidn matricial F, 
nXn, que satisface la ecuacion diferencial matricial 

(7.49) F'(x) = -F(x)P(x) 

en J con el valor inicial Fla) = I. Ademas, F(x) es no singular para cada x en J. 
Demostracion. Sea Yk(x) una solution vectorial de la ecuacion diferencial 

Yi(x) = -P(x)%(x) 

en / con vector inicial Yk(a) = h, donde h es la columna k de la matriz identi- 
dad I, nXn. Aquf P(xY representa la transpuesta de P(x). Sea G(x) la matriz 
nXn cuya columna k es Yk(x). Entonces G satisface la ecuacion diferencial ma¬ 
tricial 

(7.50) G\x) = -P(xYG{x) 

en / con valor inicial G(a) = I. Tomemos ahora la transpuesta de cada miembro 
de (7.50). Puesto que la transpuesta de un producto es el producto de las trans- 
puestas en orden invertido, obtenemos 

{G'(*)}‘ = -G(x) l P(x). 

Tambien, la transpuesta de la derivada G’ es la derivada de la transpuesta G*. 
Por tanto la matriz Fix) = G(x) 1 satisface la ecuacion diferencial (7.49) con 
valor inicial F(a) = I. 

Demostremos ahora que Fix) es no singular construyendo su inversa. Sea H 
la funcion matricial nXn cuya columna k es la solucion de la ecuacion diferencial' 


Y\x)=Plx)Ylx) 
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con valor inicial Y(a) = h, la columna k de /. Entonces H satisface el problema 
de valor inicial 

H’(x) = P(x)H(x), H(a) = /, 
en /. El producto F(x)H(x) tiene derivada 

F(x)H'(x) + F'(x)H(x) = F(x)P{x)H{x) - F(x)P(x)H(x) = O 


para cada x de /. Por consiguiente el producto F(x)H(x) es constante, F(x)H(x) = 
= F(a)H(a) — I, asi que H(x) es la inversa de Fix). Esto completa la demos- 
tracion. 

En el teorema que sigue quedan resumidos los resultados de esta seccion. 

teorema 7.16. Dadas una funcion matricial P, nXn, y una juncion vec¬ 
torial n-dimensional Q, ambas continuas en un intervalo abierto J, la solucion del 
problema de valor inicial 

(7.51) Y\x) = P(x)Y(x) + Q(x), Y(a) = B, 
en J viene dado por la formula 

(7.52) Y(x) = F(x)- 1 E(a) + F(x)- 1 /' F(t)Q(t) dt . 

La matriz Fix), nXn, es la transpuesta de la matriz cuya columna k es la solucion 
del problema de valor inicial 

(7.53) Y'(x) = -P{xy Y(x), Y(a) = I k , 

en donde h es la columna k de la matriz identidad I. 

Aunque el teorema 7.16 proporciona una formula explicita para la resolucion 
del sistema lineal general (7.51), tal formula no siempre resulta util para calcular 
la solucion debido a la dificultad que supone la determinacion de la funcion ma¬ 
tricial F. Elio exige la solucion de n sistemas lineales homogeneos (7.53). En la 
siguiente seccion se expone un metodo con series de potencias que a veces se 
emplea en la resolucion de sistemas lineales homogeneos;. 

Una vez mas recordamos al lector que la demostracion del teorema 7.16 se 
baso en el teorema de existencia 7.14, para los sistemas lineales homogeneos, que 
todavia no hemos demostrado. 
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7.19 Resolucion de sistemas lineales homogeneos mediante series de potencias 

Consideremos un sistema lineal homogeneo 
(7-54) Y'(x) = A(x) Y(x), 7(0) = B, 

en el que la matriz A, nXn, dada tiene un desarrollo en serie de potencias de x 
convergente en un cierto intervalo abierto que contenga el origen, tal como 

A{x) = A 0 + xA j + x*A 2 + -1- x k A k + ... , para |x| < r x , 

donde los coeficientes A 0 , A-i, A 2 , . .. son matrices nXn dadas. Intentemos encon- 
trar una serie de potencias solucion de la forma 


Y(x) = B 0 + xB x + x*B 2 + • • • + x k B k + • • • , 


con los vectores B 0 , B lt B 2 ,... como coeficientes. Puesto que 7(0) = B (i , la con. 
dicion inicial se satisfara tomando B 0 = B, el vector inicial prescrito. Para deter- 
minar los coeficientes restantes sustituimos la serie de potencias que da Y(x) en 
la ecuacion diferencial e igualamos los coeficientes de potencias semejantes de x 
obteniendo el siguiente sistema de ecuaciones 

(7.55) B x = A 0 B, ( k + 1 )B k+1 = 2 A r B k _ r para fc = 1,2,.... 

r=0 

Estas ecuaciones pueden resolverse en torma sucesiva respecto a los vectores 
Bi, B 2 , • ■ ■ ■ Si la serie de potencias de Y(x) que resulta converge en un cierto 
intervalo |x| < r 2 , entonces Y(x) sera una solucion del problema de valor inicial 
(7.54) en el intervalo \x\ < r, siendo r = min {r u r 2 }. 

Por ejemplo, si A(x) es una matriz constante A, entonces A 0 = A y Ak = O 
para k ^ 1, asi que el sistema de ecuaciones (7.55) se convierte en 

B x — AB, (lc + 1)B* +1 = AB k para k ^ 1. 

Resolviendo esas ecuaciones sucesivamente encontramos 

B k — A k B para k > 1. 

Por tanto en este caso la serie solucion toma la forma 
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Esto esta de acuerdo con el resultado obtenido antes para los sistemas lineales 
homogeneos con coeficientes constantes. 

7.20 Ejercicios 

1. Sean p una funcion de valores reales y Q una funcion matricial nx 1, ambas continuas 
en un intervalo /. Sea A una matriz constante nxn. Demostrar que el problema de 
valor inicial 


Y'(x) = p(x)A Y(x) + Q(x), Y(a ) = B, 

tiene la solucion 

F(jc) = B + e Q ^ x)A ( x e~ q ^ A Q(t) dt 

J a 


en ], donde q(x) = J* p(t) dt . 

2. Considerar el caso particular del ejercicio 1 en el que A sea no singular, a— 0, p(x)=2x, 
y Q(x) = xC, Siendo C un vector constante. Demostrar que la solucion se convierte en 

Y(x) = e x * A (B + lA l C) - \A- l C, 

3. Sean A(t) una funcion matricial nxn y £(t) = e 41 ' 1 . Sean Q(t), Y(t ) y B matrices 
columna nxl. Supongamos que 


E\t) = A’(t)E(t) 

en un intervalo abierto /. Si a e J y si A! y Q son continuas en /, demostrar que el 
problema de valor inicial 

Y\t) = A'(t) Y(t) + Q(t), Y(a) = B, 

tiene la siguiente solucidn en /; 

Y(x) = e Alx) e~ A(a] B + e A(x) \ x e~ AU) Q(t) dt. 

J a 

4. Sea E(t) = e A{,) . Este ejercicio muestra ejemplos de funciones matriciales A(t) para las 
que E’(t) = A’(t)E(t). 

a) Que sea A(t) = t'A, donde A es una matriz constante nxn y r un entero positivo. 
Demostrar que £'(t) = A'(t)E{t) en (— •», +oo). 

b) Sea A(t) un polinomio en t con matrices como coeficientes 

m 

A(t) =2 t r A r , 

r=0 



Demostracion del teorema de existencia 


273 


siendo los coeficientes permutables A,A, — A,A, para todos los r y s. Demostrar que 
E'(t) = A'(t)E(t) en (-■», + «>). 
c) Resolver el sistema lineal homogeneo 

Y'(t) = (I + tA)Y(t), Y(0) = B 

en el intervalo (— °°, °o), donde A es una matriz constante nXn. 

5. Supongamos que la funcion matricial, nXn, A(x) admite un desarrollo en serie de po- 
tencias convergente para |x| < r . Desarrollar un procedimiento para resolver, mediante 
desarrollo en serie, el siguiente sistema lineal homogeneo de segundo orden: 

Y"(x) = A(x)Y(x), con K(0) = B, Y'( 0) = C. 

6 . Considerar el sistema de segundo orden Y"(x) + AY(x) = 0, con y(0) = B, y'(0) = C 
donde A es una matriz constante nXn. Demostrar que el sistema tiene la serie de po- 
tencias solucion 


Y(x) = 



( —l) s x 2 M S: \ 
(2k)\ ) B + 



(-1 fx ik+1 A k 
(2k + 1)! 


C 


convergente para — oo < x < + oo . 


7.21 Demostracion del teorema de existencia por el metodo de las aproximaciones 
sucesivas 

En esta seccion demostramos la existencia y unicidad de una solucion para 
cualquier sistema lineal homogeneo 

(7.56) Y'(t) = A(t)Y(t), 

donde A(t) es una funcion matricial nXn, continua en un intervalo abierto /. 
Demostraremos que para un punto cualquiera a de / y cualquier vector inicial B 
existe exactamente una solucion Y(t) en / que satisface la condicion inicial 
Y(a) = B. 

Usaremos el metodo de aproximaciones sucesivas, que es un metodo iterativo 
aplicable tambien a otros muchos problemas. Fue publicado primero por Liouville 
en 1838 en conexion con el estudio de las ecuaciones diferenciales lineales de se¬ 
gundo orden. Mas tarde fue extendido por J. Caque en 1864, L. Fuchs en 1870, 
y G. Peano en 1888 al estudio de las ecuaciones lineales de orden n. En 1890 
Emile Picard (1856-1941) extendio el metodo al abarcar tambien las ecuaciones 
diferenciales no lineales. En reconocimiento a su contribucion fundamental, al- 
gunos autores lo citan como el metodo de Picard. El interes del metodo no es 
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solo teorico sino que tambien se usa en algunos casos para obtener las aproxima- 
ciones numericas de las soluciones. 

El metodo empieza tomando una supuesta solucion de la ecuacion (7.56). 
Tomamos como tal el vector inicial dado B, si bien esto no es esencial. Sustituimos 
entonces esta supuesta solucion en el segundo miembro de la ecuacion y obtene- 
mos una nueva ecuacion diferencial 

Y\t) = A(t)B. 

‘En esta ecuacion el segundo miembro ya no contiene la funcion incognita, asi 
que la ecuacion puede resolverse inmediatamente integrando ambos miembros 
entre a y x, siendo x un punto arbitrario de /. Esta ecuacion tiene exactamente 
una solucion Yi en / que satisface la condicion inicial Y^a) = B, o sea 

Y x (x) = B + f x A(t)Bdt. 

da 

Reemplazamos ahora Y(f) por Y,(t) en el segundo miembro de la ecuacion 
diferencial original (7.56) obteniendo una nueva ecuacion diferencial 

no = A(t)Y 1 ( t ). 

Esta ecuacion tiene una sola solucion Y 2 en / con la condicion Y 2 (a) = B, 

(7.57) Y 2 (x) = B + j X AiOYM dt. 

J a 

Sustituimos entonces Y 2 en el segundo miembro de (7.56) y resolvemos la ecuacion 
resultante para determinar Y 3 con Y 3 (a) = B, y asi sucesivamente. Este proceso 
engendra una sucesion de funciones Y„, Y u Y 2 ,..., en la que Y„ = B y donde 
Yk+i se determina a partir de Y k mediante la formula de recurrencia 

(7.58) Y k+ i(x) = B + j“ Mt)Y k (t) dt para k = 0,1,2, - 

Nuestro objetivo es demostrar que la sucesion de funciones asi definida con¬ 
verge hacia una funcion limite Y que es una solucion de la ecuacion diferencial 
(7.56) en / y que tambien satisface la condicion inicial Y(a) = B. Las funciones 
Y„, Y,, Y,, . . . se llaman aproximaciones sucesivas de Y. Antes de estudiar la con¬ 
vergence del proceso ilustramos el metodo con un ejemplo. 

ejemplo. Consideremos el problema de valor inicial Y'(t) = AY(t), Y(0) = /j, 
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donde A es una matriz constante nXn. Sabemos que la solution esta dada por la 
formula Y(x) = e xA B para todo x real. Demostraremos como esta solution se 
puede obtener por el metodo de las aproximaciones sucesivas. 

La hipotesis initial es Y 0 (x) — B. La formula de recurrencia (7.58) nos da 

Yi(x) = B + J* AB dt = B + xAB, 

Y 2 (x) = B + i X AY 1 (t ) dt = B+ f* ( AB + tA 2 B) dt = B + xAB + \x 2 A 2 B. 

*0 v o 

Por induccion encontramos 


Y k (x) = B + xAB + \x 2 A 2 B + • • • + ± x k A k B = 

La suma del segundo miembro es una suma partial de la serie de e xA . Por consi- 
guiente cuando k -* °° encontramos 

lim Yt(x) = e xA B 

00 

para todo x. Asf pues, en este ejemplo podemos demostrar directamente que las 
aproximaciones sucesivas convergen hacia una solucion del problema de valor ini¬ 
tial en (— °o, + oo). 

Demostracidn de la convergencia de la sucesion de las aproximaciones suce¬ 
sivas. Volvamos ahora a la sucesion general definida por la formula de recurren¬ 
cia (7.58). Para demostrar que la sucesion converge escribimos cada termino 
Yjt(x) como una suma telescopica, 

(7.59) Y k (x) = Y 0 (x) + 2 {Y m+1 (x) - Y m (x)} . 

m=0 

Para demostrar que Yk(x) tiende hacia un lfmite cuando k demostraremos 
que la serie 

00 

(7.60) 2 { Y m+ i(x) - Y m (x)} 

m— 0 

converge para cada x de /. A tal fin basta demostrar que la serie 

I I! Y m+1 (x) - Y m (x)|| 

tn=0 


(7.61) 
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converge. En esta serie utilizamos el concepto de norma de una matriz introducido 
en la section 7.3; la norma de una matriz es la suma de los valores absolutos de 
todos sus terminos. 

Consideremos un subintervalo acotado y cerrado /i de / que contenga a. 
Demostraremos que para todo x de J 1 la serie (7.61) es mayorada por una serie 
convergente de constantes independientes de x. Esto implica que la serie conver¬ 
ge uniformemente en / 1 . 

Para hacer una estimacion de la magnitud de los terminos de (7.61) utiliza¬ 
mos repetidamente la formula de recurrencia. Inicialmente, tenemos 

Y 1 (x) - Y 0 (x) = j X A(t)B dt. 

•'a 

Para mayor sencillez, supongamos que a < x. Entonces podemos escribir 
(7.62) || Y x (x) - Y 0 (x)|| = || J* A{i)B dt || ^ j‘ |M(t)|| ||B|| dt. 

Puesto que cada elemento de A(t) es funcion continua en /, cada elemento 
esta acotado en el intervalo cerrado acotado J x . Por consiguiente ||/t(f)|| ^ M, 
donde M es la suma de las cotas de todos los elementos de A(t) en el intervalo 
I j. (El numero M depende de J t .) Por consiguiente el integrando de (7.62) esta 
acotado por ||B||M, asi que tenemos 

|| Yj(x) - Y 0 (x)|| < f ||B|| M dt = ||fi|| M(x - a) 
para todo x > a en /j. 

Utilicemos ahora la formula de recurrencia una vez mas para expresar la 
diferencia Y 2 — Y t en funcion de Yi — Y„, y luego empleamos la estimacion que 
acabamos de obtener para Yi — Y 0 , y se deduce 

II Y 2 (x) - Y x (x)|| = || {* X(0{Yx(0 - Y 0 (t)} dt || ^ f* M(0I| ||B|| M(t - a) dt 
£ ||B|| M 2 J x (t — a) dt = ||B|| - 2(X ~ 0)2 


para todo x > a en /,. Por induccion encontramos 

ii w*> - y»(*)ii < iibii M ^ 1(x ~ a , r+1 p ara m = 0 ’ I* 2 ,..., 

(m + 1)! 

y para todo x > a de /i. Si x < a un razonamiento parecido da la misma desigual- 
dad con |x — a\ en lugar de (x — a). Si designamos con L la longitud del intervalo 
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/,, entonces tenemos \x — a\ ^ L para todo x de /i as! que obtenemos la acotacion 

\Am+ljm+l 

II y».+i(x) — ^mWII < ll-BII 7 -— para m — 0 , 1 , 2 ,, 

(m + 1 )! 


para todo x de J 1 . Por consiguiente la serie de (7.61) es mayorada por la serie 
convergente 


QQ 

pii 2 

m=Q 


(. ML) m+x 

(m + 1 )! 


= || 61| (e-' IL - 1 ). 


Esto demuestra que la serie (7.61) converge uniformemente en J x . 

El razonamiento anterior demuestra que la sucesion de aproximaciones suce- 
sivas siempre converge y en /, la convergencia es uniforme. Sea Y la funcion 
llmite. Esto es, definimos Y(x) para cada x en /, por 

Y(x) = lim Y k (x). 

k~* oo 

Demostraremos que Y tiene las propiedades siguientes: 

a) Y es continua en /,. 

b) Y(x) = B + A(t) Y(t) dt para todo x de /,. 

c) Y(a) = B e Y’(x) = A(x) Y(x) para todo x de /,. 

La parte c) demuestra que Y es una solucion del problema de valor inicial en ) 1 . 

Demostracidn de a). Cada funcion Y* es una matriz columna cuyos ele- 
mentos son funciones escalares, continuas en /,. Cada elemento de la funcion 
llmite Y es el llmite de una sucesion uniformemente convergente de funciones 
continuas, as! que, segun el teorema 11.1 del volumen I, cada elemento de Y es 
tambien continua en /,. Por consiguiente Y es continua en /,. 

Demostracidn de b). La formula de recurrencia (7.58) establece que 
Y k+1 (x) = B + j*A(t)Y k (t) dt. 

Por consiguiente 

Y(x) = lim Y* + 1 (x) — B + lim f* A(t)Y k (t ) dt = B + (* ^(OHm Y k (t) dt 

o k-> oo “ Ja 

= B + J; A(t)Y(t)dt. 

El intercambio del slmbolo de llmite con el signo integral es valido por la con¬ 
vergencia uniforme de la sucesion {y fc } en ] x . 
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Demostracion de c). La ecuacion Y(a) = B resulta al momento de b). De- 
bido al apartado a), el integrando de b) es continuo en J 1 asf que, en virtud del 
primer teorema fundamental del calculo, Y'(x) existe y es igual a A(x) Y(x) en /,. 

El intervalo /, sabemos que es un subintervalo cualquiera de / cerrado y 
acotado y que contenga a. Si /, se amplia, el proceso para obtener Y(x) no varia 
porque solo incluye la integracion de a a x. Puesto que para todo x de / existe 
un subintervalo de / cerrado y acotado y que contiene a y x, existe una solucion 
en todo el intervalo /. 

TEOREMA 7.17. TEOREMA DE UNICIDAD PARA SISTEMAS LINEALES HOMOGE- 
neos. Si Aft) es continua en un intervalo abierto ), la ecuacion diferencial 

Y'(t ) = A(t)Y(t) 

tiene a lo mas una solucion en J que satisjace una condicion inicial dada Y(a)—B. 

Demostracion. Sean Z e Y dos soluciones en /. Sea /, cualquier subinter¬ 
valo de / acotado y cerrado que contenga a. Demostraremos que Z(x) — y(x) 
para todo x en Esto implica que Z = Y en todo el intervalo J. 

Puesto que Z e Y son soluciones tenemos 

Z'(0 - Y'(t) = A(t){Z(t) - Yft)}. 

Elijamos x en /, e integremos esta ecuacion entre ay x con lo que obtenemos 

Z(x) - Y(x) = J* A(t){Z(t) - y(t)} dt. 

Esta implica la desigualdad 

(7-63) ||Z(x) - y(x)|| <m|J; \\Z(t) - y(t)|| dt |, 

donde M es una cota superior de || A(0:ll en J u Sea M, una cota superior para 
la funcion continua \\Z(t) - y(t)|| en J x . Entonces la desigualdad (7.63) nos da 

(7.64) ||Z(x) - y(x)|| < MM 1 |x - a\. 

Aplicando (7.64) en el segundo miembro de (7.63) obtenemos 

l|Z(x) - y(x)|| < M 2 M 1 1 J* \t - a \ dt | = M 2 M 1 ~ . 
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Por induction resulta 

(7.65) H Z W - E(x)j| < M m M l . 

ml 

Cuando m -> ® ei segundo miembro tiende a 0, asf que Z(x) = y(x). Esto com- 
pleta la demostracion. 

Los resultados de esta section pueden resumirse en el siguiente teorema de 
existencia y unicidad. 

teorema 7.18. Sea A una funcion mairicial nXn continua en un intervalo 
abierto J. Si a e J y B es un vector n-dimensional cualquiera, el sistema lineal ho- 
mogeneo 


Y'(t) = A(t)Y(t), Y(a) = B, 

tiene una y solo una solucion que es un vector n-dimensional en J. 

7.22 Aplicacion del metodo de aproximaciones sucesivas a los sistemas no linea- 
les de primer orden. 

El metodo de aproximaciones sucesivas tambien puede aplicarse a algunos 
sistemas no lineales. Consideremos un sistema de primer orden de la forma 

(7.66) Y' = F(t, Y), 

donde F es una funcion vectorial n-dimensional dada, e Y es una funcion vecto¬ 
rial n-dimensional incognita que hay que determinar. Queremos una solucion Y 
que satisfaga la ecuacion 


no = F[t, 7(0] 

para cada t en un cierto intervalo / y que tambien satisfaga una condition inicial 
dada, por ejemplo Y(a) = B, donde a e / y B es un vector n-dimensional dado. 

A1 igual que en el caso lineal, construimos una sucesion de aproximaciones 
sucesivas 7„, Y„ Y 2 .... tomando F 0 = B y definiendo Y k + -> en funcion de Y k 
mediante la formula de recurrencia 

(7.67) EmM = B + j“ F[t, 7*(0] dt para k = 0,1, 2,.... 

Imponiendo ciertas condiciones a F, esta sucesion convergera hacia una funcion 
lfmite Y que satisfara la ecuacion diferencial y la condicion inicial dadas. 
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Antes de averiguar la convergencia del proceso vamos a discutir algunos 
ejemplos unidimensionales elegidos para ilustrar algunas de las dificultades que 
pueden presentarse en la practica. 

ejemplo 1. Consideremos el problema de valor inicial no lineal y' — x 2 + y 2 
con y = 0 cuando x = 0. Calcularemos algunas aproximaciones de la solucion, 
Elijamos Y„(x) = 0 y determinaremos las tres siguientes aproximaciones como 
sigue: 


r * 

Yi(x) = t 2 dt = — , 
Jo 3 


Y/x) = j 

| \t 2 + Yf(0] dt = 

f(' ! + 

> 1 "ca 

II 

1 ^ ? 

'0 

Jo \ 

y/ 

3 

63 

Y(x) = J 

M 

+ 

+ 

H 

t_ 

x 3 

dt = - 

x 7 

+ t; + 

2x u x 15 

0 L \3 63/ J 

3 

63 

2079 

59535 


Ahora se ve el enorme trabajo que sera necesario para calcular mas aproximacio¬ 
nes. Por ejemplo, las dos aproximaciones siguientes Y 4 e Y 5 seran polinomios 
de grados 31 y 63, respectivamente. 

El proximo ejemplo muestra otra dificultad que puede presentarse en el 
calculo de las aproximaciones sucesivas. 

ejemplo 2. Consideremos el problema, de valor inicial, no lineal / = 2x + 
-f e v , con y = 0 cuando x = 0. Comenzamos con la funcion inicial Y 0 (x) = 0 
y encontramos 


Yi(x) = \ X (2 t + l) dt = x 2 + x, 

*'0 

Y 2 (x) = (2 1 + e' 2+( ) dt = x 2 + J* e t ‘ +t dt. 

Aqui, no se puede seguir adelante por el hecho de que la ultima integral no puede 
calcularse como expresion de funciones elementales. No obstante, para una x dada 
es posible calcular una aproximacion numerica de la integral y con ello se obtiene 
una aproximacion de Y 2 (x). 

A causa de las dificultades que hemos visto en los dos ultimos ejemplos, el 
metodo de aproximaciones sucesivas en la practica no es el mas util para la deter- 
minacion exph'cita de soluciones. El autentico valor del metodo consiste en su 
empleo para establecer teoremas de existencia. 
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7.23 Demostracion de un teorema de existencia y unicidad para sistemas no 
lineales de primer orden 

Volvamos ahora al teorema de existencia y unicidad para sistemas no lineales 
de primer orden. Imponiendo restricciones adecuadas a la funcion que aparece 
en el segundo miembro de la ecuacion diferencial 


Y' = F(x, Y), 

podemos extender el metodo de demostracion usado en el caso lineal de la sec- 
cion 7.21. 

Sea / el intervalo abierto en el que deseamos una solution. Supongamos que 
a e J y que B es un vector n-dimensional dado. Designemos con S un conjunto 
en el espacio de dimension (n + 1) dado por 

S = {(x,Y)\ \x-a\<h,\\Y-B\\<k}, 

donde h > 0 y k > 0. [Si n — 1, es un rectangulo con centro en (a, B), con base 
2 h y altura 2k.] Supongamos que el dominio de F incluye un conjunto S de este 
tipo y que F es acotada en S, sea 

(7.68) \\F(x, 7)|| <, M 

para todo punto {x, Y) de S, siendo M una constante positiva. 

Seguidamente, supongamos que la funcion compuesta G{x) = F(x, Y(x)) es 
continua en el intervalo (a — h,a + h) para toda funcion Y que sea conti- 
nua en (a — h, a + h) y que tenga la propiedad de que ( x, Y(x)) e S para 
todo x en (a — h, a + h). Esta hipotesis asegura la existencia de las integrales 
que se presentan en el metodo de aproximaciones sucesivas, e implica tambien 
la continuidad de las funciones asi construidas. 

Finalmente, supongamos que F satisface una condicion de la forma 

||F(x, Y)-F(x,Z )|| \\Y-Z\\ 

para todo par de puntos ( x, Y) y (x, Z) de S, siendo A una constante positiva. 
Esta se llama una condicion de Lipschitz en honor de Rudolph Lipschitz, que fue 
el primero en introducirla en 1876. Una tal condicion no es un restriccion muy 
seria para una funcion y nos permite extender la demostracion de la existencia 
y unicidad del caso lineal al no lineal. 

TEOREMA 7.19. EXISTENCIA Y UNICIDAD DE LAS SOLUCIONES DE SISTEMAS NO 

lineales de primer orden. Supongamos que F satisface la acotacion, la conti- 
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nuidad y las condiciones de Lipschitz antes citadas en un conjunto S. Sea I el 
intervalo abierto (a — c, a + c), donde c = min {h, k/M}. Existe entonces una 
y solo una funcion Y definida en I, siendo Y(a) = B, tal que (x, Y(x)) e S y 

Y\x) = F(x, Y(x)) para cada x de I. 

Demostracion. Puesto que la demostracion es analoga a la del caso lineal 
indicamos solamente los principales pasos. Pongamos Y„(x) = B y definamos las 
funciones vectoriales Y,, Y 2) ... en / mediante la formula de recurrencia 

(7-69) Y m+1 (x) = B + )* F[t, Y m (t)] dt para m = 0, 1, 2,... . 

Para que la formula de recurrencia tenga sentido necesitamos saber si (x, Y m (x)) 
e S para cada x de /. Esto se demuestra facilmente por induccion en m. Cuando 
m — 0 tenemos (x, Y„(x)) = (x, B ), que esta en S. Supongamos entonces que 
(x, Y m (x )) e S para un m y cada x de /. Utilizando (7.69) y (7.68) obtenemos 


Y m+ M-B\\< \\F[t,Y m m\dt <M 


dt 


= M \x — a\. 


Puesto que \x — a\ < c para x en I, esto implica que 


II Y m+1 (x) - B\\ < Me £k, 

lo cual demuestra que lx, Y m+1 (x)) e S para cada x en I. Por consiguiente la 
formula de recurrencia tiene sentido para todo m>0y toda x de I. 

La convergencia de la sucesion { Y m (x) } se establece ahora exactamente como 
en la seccion 7.21. Escribamos 


Y k {x) = Y 0 (x) + I{Y m+1 (x) - YJx)} 

m =0 

y demostremos que Yk(x) tiende hacia un lfmite cuando k -* °° demostrando que 
la serie 


I II y m +i(x) - YJXMl 

m=0 

converge en /. Esto se deduce de la desigualdad 

II nn +1 W ~ 'Y m (x)|| < ~~ Am |X ~ ar+1 


< MAm c m+i 
~ (m + 1 )! 


(m + 1 )! 



Ejercicios 


283 


que se demuestra por induction, usando la formula de recurrencia y la condition 
de Lipschitz. Definimos entonces la function lfmite Y por 

y(x) = lim y m (x) 

m~*oo 

para cada x de / y comprobamos que satisface la ecuacion integral 

y(x) — B + f x F[t, Y(t)]dt, 

exactamente como en el caso lineal. Esto demuestra la existencia de una solution. 
La unicidad puede entonces demostrarse por el mismo metodo utilizado para de- 
mostrar el teorema 7.17. 

7.24 Ejercicios 


1. Considerar el problema lineal de valor initial 

y + y = 2e x , con; y — 1 cuando x = 0. 

a) Hallar la solucidn exacta Y de este problema. 

b) Aplicar el metodo de aproximaciones sucesivas, partiendo de la funcidn inicial 

y»(x) = 1. 

Determinar Y„(x) explicitamente y demostrar que 

lim Y n (x) = Y(x) 


para todo x real. 

2. Aplicar el metodo de aproximaciones sucesivas al problema de valor inicial no lineal 

y — x + y 2 , con y = 0 cuando x = 0. 

Tomar y 0 (x) = 0 como funcion inicial y calcular Yi(x). 

3. Aplicar el metodo de aproximaciones sucesivas al problema de valor inicial no lineal 

y — 1 + xy 2 , con y — 0 cuando x = 0. 

Tomar Y<,(x) = 0 como funcidn inicial y calcular y 3 (x). 

4. Aplicar el metodo de aproximaciones sucesivas al problema de valor inicial no lineal 

y = x 2 + y 1 , con y — 0 cuando x = 0. 
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Partir de la «mala» funcion inicial Y 0 (x) = 1, calcular Ys(x), y comparar con los resul- 
tados del ejemplo 1 de la section 7.22. 

5. Considerar el problema de valor inicial no lineal 


y = x 2 + y 2 , con y = 1 cuando x = 0. 


a) Aplicar el metodo de aproximaciones sucesivas, partiendo de la funcion inicial 
Y 0 (x) = 1, y calcular YAx). 

b) Sea R = [ — 1,1] X [ — 1,1] . Hallar el menor M tal que |/(x, y)| < M en R. Hallar 
un intervalo / = (— c, c) tal que la grafica de toda funcion aproximante Y„ en I, este 
en R. 

c) Supongase que la solucion y = Y(x) tiene un desarrollo en serie de potencias en un 
entorno del origen. Determinar los seis primeros terminos no nulos de ese desarrollo y 
comparar el resultado con el del apartado a). 

6. Considerar el problema de valor inicial 

y' = 1 + y 2 , con y = 0 cuando x = 0. 

a) Aplicar el metodo de aproximaciones sucesivas, partiendo de la funcidn inicial 
YoM = 0, y calcular Y,(x). 

b) Demostrar que toda funcion aproximante Y„ esta definida en todo el eje real. 

c) Utilizar el teorema 7.19 para demostrar que el problema de valor inicial tiene por 
lo menos una solucion en cualquier intervalo de la forma (—h, h). 

d) Resolver la ecuacion diferencial por separacion de variables y demostrar asf que 
existe una sola solucion Y del problema de valor inicial en el intervalo (—v/2,nr/2) y 
ninguna en un intervalo mas amplio. En este ejemplo, las aproximaciones sucesivas estan 
defmidas en todo el eje real, pero convergen hacia una funcion limite unicamente en 
el intervalo { — it 12, tt/2). 

7. Busquemos dos funciones y = Y{x) y z — Z(x) que satisfagan simultaneamente el sis- 
tema de ecuaciones 


/ = z > z' = x*(y + z) 

con las condiciones iniciales y = 1 y z =1/2 cuando x = 0. Comenzar con las fun¬ 
ciones iniciales Y 0 (x) = 1, Z„(x) = 1/2, y emplear el metodo de aproximaciones sucesi¬ 
vas para obtener las funciones aproximantes 



= 1 

X 

+ r + 

3.x 5 

-f~ —— -f- 

X 9 


2 

40 

60 

192 ’ 

Z l(x) 

1 
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X 5 
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— - 

H — ~ 

+ — 
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10 
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8. Considerar el sistema de ecuaciones 


y' =2x + z. 


z' = 3 xy + x 2 z, 
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con valores iniciales y = 2 y z — 0 cuando x = 0. Partir de las funciones iniciales 
Yo(x) = 2, Zn(x) = 0, y con el metodo de aproximaciones sucesivas determinar Yi(x) 
y Z,(x). 

9. Considerar el problema de valor inicial 


y" = x 2 y' + x 4 y, con y — 5 e y’ = 1 cuando x = 0. 

Cambiar este problema en otro equivalente que incluya un sistema de dos ecuaciones 
con dos funciones incdgnitas y = Y(x) y z = Z(x), siendo z = y'. Aplicar entonces el 
metodo de aproximaciones sucesivas, partiendo de las funciones iniciales Y a (x) = 5 y 
Zo(x) = 1, y determinar Y } (x) y Z}x). 

10. Sea / una funcion definida en el rectangulo R — [ — 1,1] X [ — 1,1] del modo siguiente: 


fix,}') 


0 

si 

x = 0, 



2 ylx 

si 

* 9* 0 e 

w 

CJ 

X 

VI 

2x 

si 

x ^ 0 g 

y 

> X 2 , 

—2x 

si 

x *0 e 

y 

< -X 2 


a) Demostrar que |/(x,y)| < 2 para todo (x, y) de R. 

b) Demostrar que / no satisface una condition de Lipschitz en R. 

c) Para cada constante C que cumple |C| < 1, demostrar que y = Cx 2 es una soluci6n 

del problema de valor inicial y' = f(x, y), con y = 0 cuando x = 0. Demostrar que la 

grafica de cada una de esas soluciones en ( — 1,1) esta en R. 

d) Aplicar el metodo de aproximaciones sucesivas al problema de valor inicial, par¬ 
tiendo de Yo(x) = 0. Determinar Y n (x) y demostrar que las aproximaciones convergen 
hacia una solucion del problema en el intervalo (—1,1). 

e) Repetir la parte d), partiendo de Y a (x) = x. Determinar Y„(x) y demostrar que las 
funciones aproximantes convergen hacia una solucion diferente de cualquiera de las 
del apartado c). 

f) Repetir la parte d), partiendo de Yo(x) = x 3 . 

g) Repetir la parte d), partiendo de Yo(x) = x'/ 1 . 


* 7.25 Aproximaciones sucesivas y puntos fijos de operadores 

La idea basica del metodo de aproximaciones sucesivas puede usarse no solo 
para establecer teoremas de existencia para ecuaciones diferenciales sino tambien 
para otros muchos problemas del analisis. El resto de este capitulo reformula el 
citado metodo en una forma que amplia mucho el alcance de sus aplicaciones. 

En la demostracion del teorema 7.18 construimos una sucesion de funciones 
{Y*:} de acuerdo con la formula de recurrencia 
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El segundo miembro de esta formula puede considerarse como un operador T que 
convierte ciertas funciones Y en otras nuevas T(Y) mediante la ecuacion 

T(Y) = B + f* AY(t)dt. 

da 

En la demostracion del teorema 7.18 encontramos que la solucion Y del problema 
de valor inicial Y'(0 = AY(t), Y(a) = B, satisface la ecuacion integral 


Y — B + j X AY(t)dt. 

da 


Expresando esta con el operador T resulta Y = T(Y). Es decir, la solucion Y pen 
manece inalterada por el operador T. Una tal funcion Y se llama un punto fijo 
del operador T. 

Numerosos e importantes problemas del analisis pueden formularse de modo 
que su solucion dependa de la existencia de un punto fijo para algun operador. 
Por consiguiente merece la pena intentar descubrir propiedades de operadores que 
garanticen la existencia de un punto fijo. Volvamos ahora a un tratamiento sis 
tematico de este problema. 

* 7.26 Espacios lineales normados 

Para formular el metodo de aproximaciones sucesivas en una forma mas ge¬ 
neral conviene trabajar con espacios lineales. Sea S un 'espacio lineal cualquiera. 
Cuando hablamos de aproximar un elemento x de S mediante otro elemento 
y de S, consideramos la diferencia x — y, que llamamos el error de aproxima- 
cion. Para medir el tamano de ese error introducimos una norma en el espacio. 

definicion de norma. Sea S un espacio lineal cualquiera. Una funcion 
real N definida en S se llama norma si tiene las propiedades siguientes: 

a) N(x) > 0 para cada x de S. 

b) N(cx) = |c| N(x) para cada x de S y cada escalar c. 

c) N(x + y) < N(x) + N(y) para todo par x e y de S. 

d) N(x) = 0 implica x — O. 

Un espacio lineal con una norma asignada se llama espacio lineal normado. 

La norma de x a veces se indica con j|x|j en lugar de N(x). Con esta nota- 
cion las propiedades fundamentals se expresan: 

a) |Jx!| > 0 para cada x de S. 

b) Ijcxjl = jc| 11*!| para todo x de S y todo escalar c. 
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c) -\\x + y|| jlxj! + i|y|! para todo par x e y de S. 

d) j|x ! | = 0 implica x — O. 

Si x e y estan en S, la norma jlx — y[ se llama distancia de x a y. 

Si el espacio S es euclideo, tiene siempre una norma que es consecuencia del 
producto interior, es decir, Six!! = (x, x)' /2 . Sin embargo, nosotros nos interesare- 
mos por una norma especial que no resulta de un producto interior, 

ejemplo. La norma del maximo o max norma. Sea C(/) el espacio lineal 
de las funciones reales continuas en un intervalo cerrado y acotado /. Si (p e C(/), 
definimos 


IMI = max |?<x)|, 

xeJ 

donde el simbolo del segundo miembro significa el maximo valor absoluto de 
<p en /. El lector puede comprobar que esta norma goza de las cuatro propieda- 
des fundamentales. 

La norma del maximo no se deduce del producto interior. Para demostrarlo 
basta hacer ver que la norma del maximo deja de cumplir alguna propiedad que 
poseen todas las normas deducidas de productos interiores. Por ejemplo, si una 
norma se deduce de un producto interior, la «ley del paralelogramo» 

II* + yV + II* - y \\ 2 = 2 ||x|| 2 + 2 llyll 2 

es valida para todo par x e y de S. (Ver ejercicio 16 de la seccion 1.13). La ley 
del paralelogramo no siempre queda satisfecha por la norma del maximo. Por 
ejemplo, sean x e y funciones en el intervalo [0,1] dadas por 

x(t) = t, y(t ) = 1 - /. 

Entonces tenemos |Lx|| = ||y|| = ||x + y|i = ||x - y|| = 1, con lo que la ley del 
paralelogramo no se cumple. 

• 7.27 Operadores de contraccion 

En esta seccion consideramos el espacio lineal normado C(J) de todas las 
funciones reales continuas en un intervalo cerrado y acotado / en el que ||9?|| es 
la norma del maximo. Consideremos un operador 

T: C(J) 

cuyo dominio es C(/) y cuyo recorrido es un subconjunto de C(/). Esto es, si <p es 
continua en /, entonces T(<p) tambien es continua en /. Las siguientes formulas 
dan algunos ejemplos sencillos de tales operadores. En cada caso <p es una funcion 
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arbitraria en C(J) y T(<p)(x) se define para cada x de / por la formula que se 
indica 

T(<p)(x) = X<f{x), donde A es un numero real fijo, 

T(<p)(x ) = x <p(t) dt, donde c es un punto fijo en /, 

Jc 

T{cp){x) = b + ?(')] dt, 


siendo b una constante y la funcion compuesta f[t, cp(t )] continua en /. 

Nos interesan ahora aquellos operadores T para los que la distancia ||r(<p) — 
— T{y)\\ es menor que el producto de l|<p — y|| por una constante a < 1. Esos se 
llaman operadores de contraccion; se definen del modo siguiente. 

definicion de un operador de contraccion. Un operador T: C(J)~>C(J) 
se llama de contraccion si existe una constante a, que sea 0 ^ < 1 , tal que para 

todo par de funciones cp y $ de C(J) tenemos 

(7.70) WT(cp) - T(y>)\\ < v. \\<p - v \\. 

La constante a se llama constante de contraccion para T. 

Nota: La desigualdad (7.70) es valida si y solamente si 


| T(<p)(x) — T(y)(x) 1 <; a | \q> — v\\ para todo xdej. 

EfEMPLO 1 . Sea T el operador definido por T(cp)(x) = ><p[x), donde A es 
constante. Puesto que 


I T(<p)(x) - T(y>)(x )| = |A| | q>(x) - y(*)l , 

tenemos }|T(qp) — T(0\ = |A| \\<p — <j/\\. Por consiguiente este operador es un ope¬ 
rador de contraccion si y solo si j Al < 1, en cuyo caso W puede usarse como cons¬ 
tante de contraccion. 

e[emplo 2. Sea T{<f){x ) = b + /[/, <p(0] dt, donde / satisface una 

condicion de Lipschitz de la forma 


\f(x,y) ~f{x, z )| <K\y - z\ 

para todo x de /, y cualesquiera z e y reales; K es una constante positiva. Desig- 
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nemos con L(/) la longitud del intervalo /. Si KL {]) < 1 podemos ver facilmente 
que T es un operador de contraccion con la constante de contraccion KL(J). En 
efecto, para toda x de / tenemos 


I T(<p)(x) - T(y>)(x)| = | J* {f[t, (p{t)] -f[t, f(t)]} dt | < K | J* \<p(t) - w {t) \ dt | 
< K \\<p - f\\ | J* dt | < KL(J ) ||fo - f\\. 

Si KL(J) < 1, entonces T es un operador de contraccion con constante de'con¬ 
traccion a = KLiJ). 

* 7.28 Teorema del punto fijo para operadores de contraccion 

El teorema siguiente demuestra que todo operador de contraccion tiene un 
punto fijo unico. 


teorema 7.20. Sea T:C(]) C(/) un operador de contraccion. Existe una 

funcion y solo una <p en C(]) tal que 

(7.71) Ticp) = cp. 

Demostracion. Sea <p 0 cualquier funcion de C(J) y definamos una sucesion 
de funciones { 9 ? n } mediante la formula de recurrencia 

<Pn+i = T(cp n ) para n = 0, 1,2. 

Observese que <p „ +1 eC(/) para cada n. Demostraremos que la sucesion {(p n ) con¬ 
verge hacia una funcion limite 9 ? de C(/). El metodo es parecido al utilizado en 
la demostracion del teorema 7.18. Escribimos cada y „ como suma telescopica, 

n —1 

(7.72) <P„(x) = (p a (x) + 2 - Vkix)} 

k =0 

y probamos la convergencia de {< y n } demostrando que la serie 

(7.73) 9 ? 0 (x) + f {%+dx) - %(x)} 

k =0 

converge uniformemente en /. Luego demostramos que la suma de esa serie es el 
punto fijo que se cita. 
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La convergencia uniforme de la serie se establecera comparandola con la 
serie geometrica convergente 

M f a\ 

k =0 

donde M = \\<p 0 \\ + ||<Pi||, y a es la constante de contraccion para T. La compa- 
racion la proporciona la desigualdad 

(7.74) Ift+iW - <p k (x )| < Ma* 

que es valida para toda x de / y todo fc > 1. Para demostrar (7.74) notemos que 
\<Pk+iM - <p k (x) I = I T(q> k )(x) - T(<f k ^)(x)\ < a || cp k - <p k ^\\. 

Por consiguiente la desigualdad (7.74) quedara probada si demostramos que 
(7-75) \\cp k - 9V.J < Mx k ~ l 

para todo 1. Demostremos ahora (7.75) por induccion. Para k = 1 tenemos 
II <Pi - ^oll < ll^ill + |l9>oll = M, 

que es la misma que (7.75). Para demostrar que (7.75) es valida para k + 1 si 
lo es para k observemos que 

lftnW - Vt(x )| = | T((p k ){x) - n<P*-d(x )I < a \\<p k ~ %-il| < Mx k . 

Puesto que esta es valida para cada x de f tambien debe ser 

llTWi — <Pk\\ < 4/a*. 

Esto demuestra (7.75) por induccion. Por consiguiente la serie (7.73) converge 
uniformemente en /. Si designamos por cp(x) su suma tenemos 

(7.76) cp{x) = lira <p n (x) = < Po (x) + f {<p k+l (x) - q> k { x)}. 

n->co A:=0 

La funcion <p es continua en / porque es la suma de una serie uniformemente 



Aplicaciones del teorema del punto fijo 


291 


convergente de funciones continuas. Para demostrar que (p es un punto fijo de T 
comparamos T(<p) con q» n+1 = 7'(<■/ „). Utilizando la propiedad de contraccion de 
T tenemos 

(7.77) | TtoXx) - <p n+1 (x )| = | T(<p)(x) - T(<p n ){x)\ < « \<p(x) - <p n {x)\. 

Pero de (7.72) y (7.76) encontramos 


\ ( P(X) ~ <Pn(x) | = 


00 


I 


{<Pk+ iW - ?k(x)} 


oo oo 

< 1 Wk+i( x ) ~ <Pk(x)\ < M 2 y k , 


k=n 


k= n 


donde hemos utilizado (7.74) en el ultimo paso. Por consiguiente (7.77) implica 
\T(<p)(x) - cp nrl (x)\ < m | ix ‘ +1 . 

k=n 

Cuando «-»<» la serie del segundo miembro tiende a 0, asf que <p„ + dx)~*T(<pXx). 
Pero ya que <p„ +1 (x)->(p(x) cuando «->«=, esto demuestra queipfx) = T((p%x) para 
cada x de /. Por consiguiente cp — T(cp), asi que ip es un punto fijo. 

Por ultimo demostramos que este punto fijo 9 ? es unico. Sea ^ otra funcion 
de C(/) tal que r(^) = Tenemos entonces 


|| 99 - v>|| = || T(<p) - T{tp) || < a || 99 - rp \\. 

Esto nos da (1 — a)\\cp— 0. Puesto que a < 1 podemos dividir por 1 — a 

obteniendo la desigualdad !1 99 — ^|| < 0. Pero como tambien tenemos jig;)— ^|j > 0 
ello significa que (1 95 — = 0, y por tanto cp— ^ = 0. La demostracion del teo¬ 

rema del punto fijo ha quedado concluida. 

* 7.29 Aplicaciones del teorema del punto fijo 

Para hacer ver el amplio alcance de las aplicaciones del teorema del punto 
fijo lo vamos a utilizar para demostrar dos teoremas importantes. El primero da 
una condicion suficiente para que una ecuacion de la forma f(x, y) — 0 defina y 
como funcion de x. 

TEOREMA 7.21. UN TEOREMA DE EX1STENCIA DE LA FUNCION IMPLICITA. 
Sea f una funcion definida en una banda R de la forma 


R = {(x, y)\a<x<b,—cc<y< +00}. 
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Supongamos que existe la derivada parcial D 2 f(x,y) m y que satisface una des- 
igualdad de la forma 

(7.78) 0 <m < D 2 f(x,y) < M 

para todo punto (x, y) de R, donde m y M son constantes tales que m < M. Su¬ 
pongamos tambien que para cada funcion <p continua en [a, b~\ la funcion com- 
puesta g(x) = f[x,cp{x)] es continua en [a, 6], Entonces existe una y solo una 
funcion y = Y(x), continua en [a, b] tal que 

(7.79) f[x, Y(x)] = 0 
para todo x en [ a, b]. 

Observacidn: Expresamos este resultado diciendo que la ecuacidn fix, y) = 0 
sirve para definir y implicitamente como funcion de x en [a, £*]. 

Demostracion. Designemos con C el espacio lineal de las funciones conti- 
nuas en [a, b], y definamos un operador T: C -> C mediante la ecuacion 

T(<p)(x) = <p(x) - --f[x, (p(x)] 

M 

para cada x de [a, 6]. La constante positiva M es la de (7.78). La funcion 
T(<p)e C siempre que <p eC. Demostraremos que T es un operador de contraccion. 
Una vez sabido esto se deducira que T tiene un punto fijo unico Y en C. Para 
esta funcion Y tendremos Y = T( Y) lo cual significa 

Y(x) = Y(x) - i/[x, y(x)j 
M 

para cada x de [a, fc]. Esto nos dara (7.79), como querfamos. 

Para demostrar que T es un operador de contraccion consideremos la dife- 
rencia 

(7.80) T(cp)(x) - T(ip)(x) = <p(x) - if>(x) - j - [x ’ y(x)] ^ 

M 

Segun el teorema del valor medio para la derivacidn tenemos 

fix, ?>(x)] -f[x, y(x)] = D 2 f[x, z( x )}[<f(x) - y(x)}, 


(*) Dif(x,y) es la derivada de f(x,y) respecto a y, manteniendo x fijo. 
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donde z(x) esta situada entre <p{x) y <p(x). Por consiguiente (7.80) nos da 

(7.81) T{<p)(x) - T(y>)(x) = fo(x) - W (x)] (l - M^- z(x)] j . 

La hipotesis (7,78) implica que 

0 < i _ D 2 /[x, z(x)] <1 _ jn 
M ~ M' 

En consecuencia (7.81) nos da la desigualdad 

(7.82) I T(<p)(x) - T(ip)(x)\ \cp(x) - y>(x)\ (l - < a \\<p - y,\\, 

donde a = 1 — m/M. Puesto que 0 < m ^ M, tenemos 0 ^ a < 1. La desigual¬ 
dad (7.82) es valida para todo x de [a, 6]. Luego T es un operador de contrac- 
cidn. Esto completa la demostracion. 

La otra aplicacion del teorema del punto fijo establece un teorema de exis- 
tencia para la ecuacion integral 

(7.83) (p(x) = tp(x) + l j* K(x, 1 ) 95 ( 1 ) dt. 

Aqul i/' es una funcion dada, continua en [a, fc], A es una constante dada, y K una 
funcion dada definida y acotada en el cuadrado 

s = {(*, y) I a < x <, b, a <, y <; b}. 

La funcion K se llama el nucleo de la ecuacion integral. Sea C el espacio lineal 
de las funciones continuas en [a, &]. Supongamos que el nucleo K es tal que el 
operador T dado por 


T(<p)(x) = tp(x) + A £ K(x, t)(p(t ) dt 

aplica C en C. Es decir, supongamos que T(<p)eC siempre que <peC. Una solu- 
cion de la ecuacion integral es cualquier funcion cp de C que satisfaga (7.83). 

TEOREMA 7.22. TEOREMA DE EXISTENCIA PARA ECUACIONES INTEGRALES. Si, 
en las condiciones impuestas, tenemos 

(7.84) !K(x,jOI ^ M 

para todo punto (x, y) de S, siendo M > 0, entonces para cada A tal que 

1 
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existe una y solo una funcion <p en C que satisface la ecuacion integral (7.83). 

Demostracidn. Demostraremos que T es un operador de contraccion. Tome- 
mos en C dos funciones cualesquiera <p t y <p 2 y consideremos la diferencia 

T(<Pi)(x) - T(<p 2 )(x) = X £' K(x, Ot(Pi(0 - dt. 

Utilizando la desigualdad (7.48) podemos escribir 

I T(<Pi)(x) ~ T(cp 2 )(x )| ^ \X\ M(b - a) - <p 2 \\ = a - <p 2 \\ , 


siendo a = |A| M(b — a). Por (7.85) tenemos 0 < a < 1, asi que T es un opera- 
dor de contraccion con a como constante de contraccion. Por consiguiente T tiene 
un punto fijo <p unico en C. Esta funcion <p satisface (7.83). 
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CALCULO DIFERENCIAL EN CAMPOS 
ESCALARES Y VECTORIALES 


8.1 Funciones de R" en R m . Campos escalares y vectoriales 

La parte 1 de este volumen se dedica principalmente a las transformaciones 
lineales 


T : V —>■ IV 

de un espacio lineal V en otro espacio lineal W. En la parte 2 prescindimos de 
que T sea lineal pero restringimos los espacios V y W a ser de dimension finita. 
Concretamente, consideramos funciones con el dominio en el espacio n-dimensio- 
nal R K y con el recorrido en el espacio m-dimensional R m . 

Cuando los dos numeros m y n son iguales a 1, una tal funcion se llama 
funcion real de una variable real. Cuando n = 1 y m > 1 se llama funcion vec¬ 
torial de una variable real. En el Volumen I se estudiaron ampliamente ejemplos 
de tales funciones. 

En este capftulo suponemos n>l yra)l. Cuando m = 1 la funcion se 
llama funcion real de una variable vectorial o, mas brevemente, un campo escalar. 
Cuando m > 1 se llama funcion vectorial de una variable vectorial, o simple- 
mente campo vectorial. 

Este capftulo extiende los conceptos de lfmite, continuidad y derivada, a 
los campos escalares y vectoriales. Los Capftulos 10 y 11 extienden el concepto 
de integral. 

Notacion: Los escalares se designaran con tipo de letra corriente, y los vec- 
tores con tipo de letra negrita. Si / es un campo escalar definido en un punto 
x = ( x u . . . , x„) en R", la notacion f(x) y f(x u . . ., x„) se usan indistintamente 
para designar el valor de / en un cierto punto. Si / es un campo vectorial pone- 
mos f(x) o/(x,,... ,x.n) para el valor de la funcion enx. Utilizaremos el producto 
interior 
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xy = J,x k y k 

k=l 

y la correspondiente norma ||jc|| = ( x • x)' A , donde x = (x t ,. . . ,x„ ) ey= (yi, . . ,y n )- 
Los puntos de R 2 ordinariamente se indican por ( x , y) en lugar de (x u x 2 ); y los 
de R 3 por {x, y, z) en lugar de (x 1; x 2 , x 3 ). 

Los campos escalares y vectoriales definidos en subconjunto de R 2 y R 3 se 
presentan con frecuencia en las aplicaciones de la Matematica a las Ciencias natu- 
rales y a la Ingenieria. Por ejemplo, si a cada punto x de la atmosfera le asigna- 
mos un numero real f(x) que represente la temperatura enr, la funcion / ast 
definida es un campo escalar. Si asignamos un vector que represente la velocidad 
del viento en aquel punto, obtenemos un ejemplo de campo vectorial. 

En problemas de Fisica que tratan con campos escalares o vectoriales es 
importante saber como varia el campo al pasar de un punto a otro. En el caso 
uni-dimensional la derivada es el instrumento matematico utilizado para estudiar 
tales cambios. La teoria de la derivada en el caso uni-dimensional maneja fun- 
ciones definidas en intervalos abiertos. Para extender la teoria a R n consideramos 
generalizaciones de intervalos abiertos llamados conjuntos abiertos. 

8.2 Bolas abiertas y conjuntos abiertos 

Sean a un punto dado en R” y r un numero positivo dado. El conjunto de 
todos los puntos x de R" tales que 


II* — a|| < r 

se llama n-bola abierta de radio r y centro a. Designamos este conjunto con B(a;r). 

La bola B{a;r ) esta nstituida por los puntos cuya distancia a a es menor 
que r. En R l es simplemente un intervalo abierto con punto medio en a. En R 2 
es un disco circular, y en R 3 es un solido esferico con centro en a y radio r. 

definicion de punto interior. Sea S un subconjunto de R”, y suponga- 
mos que a e S. Se dice que a es punto interior de S si existe una n-bola abierta 
con centro en a, cuyos puntos pertenecen todos a S. 

Es decir, todo punto a interior de S puede rodearse por una n-bola B(a ) tal 
que B(a)^S. El conjunto de todos los puntos interiores de S se llaman el interior 
de S y se designa con in S. Un conjunto abierto que contenga un punto a se llama 
a veces entorno de a. 

definicion de CONJUNTO abierto. Un conjunto S de R" se llama abierto 
si todos sus puntos son interiores. Es decir, S es abierto si y solo si S = int S. 
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ejemplqs. En R 1 el tipo mas sencillo de conjunto abierto es un intervalo 
abierto. La reunion de dos o mas intervalos abiertos es tambien abierto. Un inter¬ 
valo cerrado [a, b] no es un conjunto abierto porque ninguno de los extremes 
del intervalo puede encerrarse en una 1-bola situada enteramente en el intervalo 
dado. 

La 2-bola S = B(0;i) dibujada en la figura 8.1 es un ejemplo de conjunto 
abierto en R 2 . Todo punto a de S es el centro de un disco situado por entero 
en S. Para algunos puntos el radio de este disco es muy pequeno. 

Algunos conjuntos abiertos en R 2 pueden construirse tomando el producto 
cartesiano de conjuntos abiertos en R 1 . Si A 1 y A 2 son subconjuntos de R 1 , su 
producto cartesiano Ax X A 2 es-' el conjunfo definido en R 2 por 

A x x A 2 = {(a x , a 2 ) | a x e A x and a 2 e A 2 }. 

En la figura 8.2 se ha dibujado un ejemplo. Los conjuntos A x y A 2 son interva¬ 
los, y Ax X A 2 es un rectangulo. 

Si Ax y A 2 son subconjuntos abiertos de R 1 , entonces A x X A 2 sera un sub- 
conjunto abierto de R 2 . Para probar esto, elijamos un punto cualquiera a = (a,, a 2 ) 


n 

L J 


disco circular 

Figura 8.1 El disco B(0; 1) es un conjun- Figura 8.2 El producto cartesiano de dos 
to abierto en R ! intervalos abiertos es un rectangulo abierto. 

en A x X A 2 . Tenemos que demostrar que a es un punto interior de A x X A 2 . 
Puesto que Ax y A 2 son abiertos en R 1 existe una 1-bola B(a x ; r x ) en A x y una 
1-bola B(a 2 ; r 2 ) en A 2 . Sea r = min{n, r 2 }- Podemos facilmente demostrar que 
la 2-bola ( B (a; r) c A x X A 2 . En efecto, si x = (x lt x 2 ) es un punto cualquiera 
de B(a; r) entonces ||x - a\\ < r, asi que |at, - a x \ <r,y \x 2 - a 2 1 < r 2 . Luego 
Xi e B(a x ; r x ) y x 2 e B(a;r 2 ). Por consiguiente Xi e A x y e A 2 ,asi que (x x , x 2 ) 
e Ax X A t2 . Esto demuestra que todo punto de £(a; r) esta en A, X A 2 . Por lo 
tanto todo punto de A x X A 2 es un punto interior, ast que A x X A 2 es abierto. 

El lector deberia comprobar que un subconjunto abierto de R 1 ya no es un 
conjunto abierto cuando se considera como subconjunto de R 2 , porque un sub¬ 
conjunto de R 1 no puede contener una 2-bola. 
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definiciones de exterior y frontera. Un punto x se llama exterior al 
conjunto S de R" si existe una n-bola B(x) que no contiene puntos de S. El con- 
junto de todos los puntos de R" exteriores a S se llama el exterior de S y se de- 
signa con ext S. Un punto que no es interior ni exterior a S se llama punto fron¬ 
tera de S. El conjunto de todos los puntos frontera de S es la frontera de S y se 
designa con 3 S. 

Estos conceptos se representan en la figura 8.1. El exterior de S es el con¬ 
junto de todos los x tales que [|jt|| > 1. La frontera de S la constituyen todos 
los x con ||x|| = 1. 

8.3 Ejercicios 


1. Sean f un campo escalar definido en un conjunto S y c un numero real dado. El con¬ 
junto de todos los puntos x de S tales que fix) — c se llama conjunto de nivel de /. 
(En un capi'tulo posterior se discutiran problemas geometricos y ffsicos en los que se pre- 
sentan conjuntos de nivel.) Para cada uno de los campos escalares siguientes, S es todo 
el espacio R n . Hacer un dibujo para describir los conjuntos de nivel correspondientes a 
los valores dados de c. 

a) f(x,y) = x 2 + y?, c = 0, 1,4, 9. 

b) f{x, y) = e x,J , c = e 2 , e 1 , 1, e, e 2 , e 3 . 

c) fix, y) = cos ix + y), c = -1,0, £, £,/2, 1. 

d ) fix,y,z) = x + y + z, c= -1,0,1. 

e) fix, y, z) = x 2 + 2 y 2 + 3z 2 , c = 0, 6, 12. 

f) fix, y, z) = sen (x 2 + y 2 + z 2 ) , c = -1, -J, 0,b s f2, 1. 

2. En cada" uno de los casos siguientes, sea S el conjunto de todos los puntos (x, y ) del 
piano que satisfacen las desigualdades dadas. Hacer un grafico mostrando el conjunto S 
y explicar, geometricamente, si S es o no abierto. Indicar la frontera de S en el grafico. 

a) x 2 +/<l. h) l^x^2 y 3 < y < 4. 

b) 3x 2 + 2y 2 < 6. i) 1 < x < 2 y y > 0. 

c) |x| < 1 y \y\ < 1. j) 

d) xj>0 y y > 0 . k) x > y . 

e) |x| ^ 1 y \y\ ^ 1. 1) y > x 2 y |x| < 2. 

f) x > 0 y y < 0. m) (x 2 + f — 1)(4 — x 2 — fy > 0. 

g) xy < 1. n) (2x - x 2 - y 2 )(x 2 + y 2 — x) > 0. 

3. En cada uno de los siguientes casos, sea S el conjunto de todos los puntos (x, y, z), en 
el espacio tri-dimensional, que satisfacen las desigualdades dadas y determinar si S 
es o no abierto. 

a) z 2 — x 2 — y 2 — 1 > 0 . 

b) \x\ < 1 , \y\ < 1, y |z| < 1. 

c) x -f y + z < 1. 

d) |x| <; 1, lyl < 1, y |z| < 1. 

e) x+_y+z<l yx>0,y>0,z>0. 

f) x 2 + 4 y 2 + 4z 2 — 2x + 16 y 4- 40z + 113 < 0. 
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4. a) Si A es un conjunto abierto en un espacio de dimension n y si xi e A, demostrar 
que el conjunto A — {x}, obtenido suprimiendo de A el puntox, es abierto. 

b) Si A es un intervalo abierto en la recta real y B un subintervalo de A cerrado, de¬ 
mostrar que A — B es abierto. (*) 

c) Si A y B son intervalos abiertos en la recta real, demostrar que A n B y A u B son 
abiertos. 

d) Si A es un intervalo cerrado en la recta real, demostrar que su complemento (res- 
pecto a la recta real completa) es abierto. 

5. Demostrar las siguientes propiedades de los conjuntos abiertos en R": 

a) El conjunto vacfo 0 es abierto. 

b) R* es abierto. 

c) La reunidn de una coleccion cualquiera de conjuntos abiertos es un conjunto abierto. 

d) La interseccidn de una coleccidn finita de conjuntos abiertos es un conjunto abierto. 

e) Dar un ejemplo para demostrar que la intersection de una coleccidn infinita de con¬ 
juntos abiertos no es necesariamente abierta. 

Conjuntos cerrados. Un conjunto S en R* se llama cerrado si su complemento 
R” — S es abierto. Los tres ejercicios siguientes se refieren a las propiedades de los 
conjuntos cerrados. 

6. En cada uno de los siguientes casos, sea S el conjunto de todos los puntos (x, y ) de R 2 
que satisfacen las condiciones dadas. Hacer un grafico mostrando el conjunto S y dar 
una razdn geometrica para explicar si S es abierto, cerrado, cerrado y abierto a la vez, 
o ni cerrado ni abierto. 

a) x 2 Ay 1 ^ 0. g) 1 <, x <, 2, 3 <, y <, 4. 

b) x 2 + j 2 < 0. h)l<^x<^2,3<ij<4. 

c) x 2 + y 2 <, 1. i) y = x 2 . 

d) 1 <x 2 + y 2 <2. j) y £x 2 . 

t) \ <,x 2 +y 2 <,2. k)_y>x 2 y|x|<2. 

f) l < x 2 + y 2 <,2. 1) y > x 2 ” y |x| ^ 2. 

7. a) Si A es un conjunto cerrado en el espacio n-dimensional y x es un punto no perte- 
neciente a A, demostrar que A u {x} es tambien cerrado. 

b) Demostrar que un intervalo cerrado [a, 6] en la recta real es un conjunto cerrado. 

c) Si A y B son intervalos cerrados en la recta real, demostrar que A rt B y A u B son 
cerrados. 

8. Demostrar las propiedades siguientes de los conjuntos cerrados de R*. Pueden utilizarse 
los resultados del ejercicio 5. 

a) El conjunto vacio 0 es cerrado. 

b) R* es cerrado. 

c) La interseccidn de una coleccion cualquiera de conjuntos cerrados es cerrada. 

d) La reunion de un numero finito de conjuntos cerrados es cerrada. 

e) Dar un ejemplo para probar que la reunion de una coleccion infinita de conjuntos 
cerrados no es necesariamente cerrada. 

9. Sea S un subconjunto de R”. 

a) Demostrar que int S y ext S son ambos conjuntos abiertos. 

b) Demostrar que R* = (int S) vj (ext S) u 3S, es una reunion de conjuntos disjuntos, 

y utilizar esto para deducir que la frontera 3 S siempre es un conjunto cerrado. 

(*) Si A y B son dos conjuntos, la diferencia A — B (llamada complemento de B res- 

pecto de A) es el conjunto de todos los elementos de A que no pertenecen a B. 
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10. Dado un conjunto S de R“ y un punto x con la propiedad de que toda bola B ( x ) con- 
tiene puntos interiores y exteriores a S simultaneamente. Demostrar que x es un punto 
frontera de S. £Es cierta la proposicion inversa? Esto es, itodo punto frontera de S 
tiene necesariamente esta propiedad? 

11. Sea S un subconjunto de R\ Demostrar que ext S = int (R* — S). 

12. Demostrar que un conjunto S de R* es cerrado si y solo si S = (int S ) u 3 S. 

8.4 Limites y continuidad 

Los conceptos de lfmite y continuidad se pueden extender con facilidad a 
los campos escalares y vectoriales. Formularemos las definiciones para campos vec¬ 
toriales; las mismas se extienden a los campos escalares. 

Consideremos una funcion f: S-+R m , donde S es un subconjunto de R". Si 
a e R n y be R m escribimos 

(8.1) lim f(x) = b (o, f(x) - h cuando x a) 

x-*-a 

para significar que 

(8.2) II/W - All = 0. 

’ H*—«!l—*o 


El simbolo de Hrnite de la igualdad (8.2) es el limite corriente del Calculo ele¬ 
mental. En esta definicion no se exige que f este definida en el mismo punto a. 
Si escribimos h — x — a , la igualdad (8.2) se convierte en 

lim ||/(a + A) — A|| = 0. 

ll»>ll-o 

Para los puntos de R 2 escribimos (x, y) para x y (a, b) para a y expresamos la 
relacion de lfmite (8.1) como sigue: 

lim /(x, y) = b. 

(x,v)->(a,b) 


Para los puntos de R 3 ponemos x = (x, y, z) y a — (a, b, c) y escribimos 

lim f(x, y, z) = b. 

(x,y,z)-*(a,b,c) 


Una funcion / se llama continua en a si / esta definida en a y si 

lim/(x) =/(*). 

x~*a 

Decimos que / es continua en un conjunto S si / es continua en cada punto de S. 
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Puesto que esas definiciones son extensiones directas del caso uni-dimensio¬ 
nal, no debe sorprender que muchas de las propiedades de los limites y de la 
continuidad pueden tambien extenderse. Por ejemplo, los teoremas relativos a 
los limites y a la continuidad de sumas, productos y cocientes son tambien cier- 
tos para campos escalares. Para campos vectoriales, los cocientes no estan defi- 
nidos pero tenemos el teorema siguiente relativo a sumas, multiplicacion por es¬ 
calares, productos interiores y normas. 

teorema 8.1. Si lim fix) = A y lim g(x) — c|, tenemos tambien: 

x-~a *-»<j 

a) lim [/(*) + s(*)] = b + c. 

x-*a 

b) lim Xf(x) = Xb para todo escalar A. 

x-*a 

c) lim f(x) -g(x) = b ■ c. 

x-*-a 

d) lim ||/(*)|| = ||A||. 


Demostracion. Solo vamos a demostrar las partes c) y d); las demostracio- 
nes de a) y b) se dejan como ejercicios para el lector. 

Para demostrar c) escribimos 

/(*) • g(x) - b e = [fix) - b] ■ [g(x) - c] + b ■ [^(jc) - c] + c ■ [f(x) - b]. 

Apliquemos ahora la desigualdad triangular y la desigualdad de Cauchy-Schwarz 
obteniendo 

o < ll/M •£(*) - b • c|| < ||/(x) - All llg'(x) - c|| + IIAII list*) - c|| + Ikll ||/(*) - All 

Puesto que ||/t*) — Aj| —► 0 y Ils(*) — c|| -> 0 cuando * -> a , esto prueba que 
||/(*) •s( JC ) — A • c|| -*■ 0 cuando * -► a, lo cual demuestra c). 

Tomando /(*) = g(x) en el apartado c) encontramos 

lim ||/(*)|| 2 = ||A|| 2 , 


de la que obtenemos d). 

ejemplo 1. Continuidad y componentes de un campo vectorial. Si un cam- 
po vectorial / tiene los valores en R m , cada uno de los valores /(*) tiene m com¬ 
ponentes y podemos escribir 


/« = (AW, • • • ,/.(*)). 
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Los m campos escalares / 1 ,... ,f m se Hainan componentes del campo vectorial /. 
Demostraremos que / es continuo en un punto si, y solo si, cada componente /* 
es continuo en dicho punto. 

Designemos con e k el fc-esimo vector coordenado unidad (todos los compo¬ 
nentes de e k son 0 excepto el A>esimo, que es igual a 1). Entonces f k (x) viene 
dado por el producto interior 


/*(*) =/(*)•**• 

Por consiguiente, el apartado c) del teorema 8.1 demuestra que cada punto de 
continuidad de / lo es tambien de f k . Ademas, puesto que tenemos 

m 

f(x) = 2 f k (x)e k , 

*=1 


la aplicacion reiterada de los apartados a) y b) del teorema 8.1 demuestra que 
un punto de continuidad de todos los m componentes /,,... ,f m es tambien punto 
de continuidad de /. 

ejemplo 2. Continuidad de la funcion identidad. La funcion identidad, 
/(x) = x, es continua en todo R". Por tanto sus componentes tambien son con¬ 
tinues en todo R". Esos son n campos escalares dados por 


/i(x) = Xi,/ 2 (X) = x 2 ,... ,/„(x) = x B . 

ejemplo 3. Continuidad de las transformaciones lineales. Sea /: R n -*R m 
una transformacion lineal. Demostraremos que / es continua en cada punto a de 
R". En virtud de la linealidad tenemos 

f(a + h) =/(«) +f(h). 

Por consiguiente, basta demostrar que f{h) ->• O cuando h-+ O . Poniendo h en 
funcion de sus componentes tenemos h — h 1 e l + ■ ■ ■ + h n e n . Usando la linea¬ 
lidad, tenemos /(A) = hj{e^) + • • • + h n f(e n ). Esto demuestra que /(A) — O 
cuando A -*■ O. 

ejemplo 4. Continuidad de los polinomios de n variables. Un campo es- 
calar P definido en R n por una formula de la forma 

J>1 Pn 

P(x) = 2 • • • X c ki .. , kn x k p ■ ■ ■ x k n " 

fc 1= 0 k n =o 

se llama polinomio de n variables x 1( ... ,x„. Un polinomio es continuo en todo 
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R" debido a que es una suma finita de productos de campos escalares continuos 
en todo R n . Por ejemplo, un polinomio de dos variables x e y, dado por 

p(x, >0 = 22 wy 

i=0 j =0 

es continuo en todo punto (x, y) en R 2 . 

ejemplo 5. Continuidad de las funciones racionales. Un campo escalar f 
dado por f(x ) = P(x)lQ(x ), donde P y Q son polinomios en los componentes 
de x., se llama funcion racional. Tal funcion es continua en cada punto en donde 

GOO* o. 

Pueden construirse otros ejemplos de funciones continuas con la ayuda del 
siguiente teorema, que esta relacionado con la continuidad de las funciones com- 
puestas. 

teorema 8.2. Sean f y g dos funciones tales que la funcion compuesta 
f°g esta definida ena, siendo 

(f° g) O) =/[£(*)] • 

Si g es continua en a y f es continua en g(a), la funcion compuesta f°g es con¬ 
tinua en a. 

Demostracidn. Sean y =/(*) y b — g(a). Tenemos 

/IfOO] -/[£(«)] =f(y) -f(b). 

Por hipotesis, y -> b cuando x-> a, asi que tenemos 

„ Jim 11/feW]-/[?(«)]II = dm l!/(y) -/(*)|| = 0. 

ll*-«ll-o |[y—*j| —o 


Por consiguiente' lim f[g(x)] =/[g(a)] , asf que f°g es continua en a. 

x+a 

ejemplo 6. El teorema anterior implica la continuidad de los campos esca¬ 
lares h, cuando h(x, y) esta dada por formulas tales como 

e X+V 


sen {x 2 y\ log (x 2 + y 2 ), 


x + y 


log [cos (x 2 + y 2 )]. 
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En estos ejemplos las funciones son continuas en todos los puntos en los que estan 
definidas. La primera lo es en todos los puntos del piano y la segunda en todos los 
puntos excepto en el origen. La tercera es continua en todos los puntos (x, y) en 
los que x + y 0, y la cuarta en todos los puntos en los que x 2 + y 2 no sea un 
multiplo impar de x/2. [El conjunto de los puntos (x, y) tales que x 2 + y 2 = 
n-/2, n = 1, 3, 5, . . . , es una familia de circunferencias con centro en el origen.] 
Estos ejemplos demuestran que las discontinuidades de una funcion de dos varia¬ 
bles pueden ser puntos aislados, curvas, o familias de curvas. 

EfEMPLO 7. Una funcion de dos variables puede ser continua respecto a 
cada variable separadamente y en cambio ser discontinua como funcion de dos 
variables. Esto lo apreciamos en el ejemplo siguiente: 

/(x ’ >0 = XT7 2 si (*>j0*(o,o), /(o,o) = o. 

Para los puntos (x , y) del eje x tenemos y = 0 y f(x, y) = /(x, 0) = 0, asf que 
la funcion tiene el valor constante 0 en todo el eje x. Por consiguiente, si pone- 
mos y = 0 y consideramos / solo como funcion de x, dicha / es continua en x = 0. 
Analogamente, / tiene el valor constante 0 en todos los puntos del eje y, asi que 
si ponemos x = 0 y consideramos / como funcion solo de y, f es continua en 
y = 0. No obstante, como funcion de las dos variables, / no es continua en el ori¬ 
gen. En efecto, en cada punto de la recta y = x (excepto en el origen) la funcion 
tiene el valor constante ¥2 va que /(x, x) = x 2 /(2x 2 ) — ¥ 2 ; puesto que existen 
puntos en esa recta tan proximos al origen como queramos y ya que /(0, 0) ¥=¥ 2 , 
la funcion no es continua en (0, 0). 

8.5 Ejercicios 


Los ejercicios de esta seccidn se refieren a lfmites y a la continuidad de campos escalares 
defmidos en subconjuntos del piano. 

1. En cada uno de los siguientes ejemplos se define un campo escalar / mediante la ecua- 
cion dada para todos los puntos (x, y) del piano defmidos por la expresion del segundo 
miembro. Determinar en cada ejemplo el conjunto de puntos (x, y) en los que / es 
continua. 

a) fix, y) = x* + / - 4 X y . d) /(x, y) = tg y . 

b) f(x,y) = log (x 2 + _y 2 ). e) fix, y) = arc tg ^ . 


c) f{x, y) = - cos x 2 . 


x 

Jx 2 + y 2 


f) f{x, y) =arcsen- 
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g) fix,y) = arctan 


x + y 
1 — xy' 


i) /(x.j) =x , «'\ 


h) fix,y) 


X 

V * 2 +/ 


j) f(x,y ) = arc cos jxfy. 


2. Si lim f(x, y) = L, y si existen los dos lfmites uni-dimensionales 

( x,y)-*-(a,b) 

lim fix,y) y lim fix, y) 

x-*a y-*-b 

demostrar que 

lim [lim f(x,y)] = lim [lim f(x,y)] —L. 

x-*-a y-*-b y-*b x-*-a 

Los dos limites de esta igualdad se llaman lfmites iterados; los ejercicios demuestran 
que la existencia del lfmite bidimensional y de los dos lfmites unidimensionales, implican 
la existencia e igualdad de los dos limites iterados. (El recfproco no siempre es cierto. 
En el ejercicio 4 se da un contraejemplo.) 

3. Sea fix, y) = (x — y)/(x + y) si x + y ^ 0. Demostrar que 

lim [lim/(;t, j)] = 1 pero que lim [lim f(x,y)] = -1. 

x—0 ir-»o V -H) x-'U 

Utilizar ese resultado y el del ejercicio 2 para deducir que fix, y) no tiende a un lfmite 
cuando (x, y) —» (0,0). 

4. Sea 


■X^y2 

/(*>.>') = ~y + (x _ siempre que x 2 y 2 + (x - y) 2 * 0. 
Demostrar que 


lim [lim fix, j)] = lim [lim fix, y)] = 0 

x *0 i/—►O l/—K) x —>*-0 


pero que fix,y ) no tiende a un lfmite cuando ix, y) -» (0,0). [ Indicacidn : Examinar f 
sobre la recta y = x.] Este ejemplo demuestra que el recfproco del ejercicio 2 no siem¬ 
pre es cierto. 

5. Sea 


f(x,y) = 


1 

xsen - 

y 


lo 


si y 0, 
si y — 0. 


Demostrar que fix, y) —» 0 cuando ix, y) -> (0,0) pero que 


lim [lim fix,y)] 5* lim [lim fix, y)]. 

V-0 X-.Q X--0 y—*0 
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Explicar por qu6 esto no contradice el ejercicio 2. 

6. Si (x, y) (0,0), pongamos /(x,y) = (x 2 — y 2 )/(x 2 + y 2 ). Hallar el h'mite de fix, y) cuan- 
do (x, y) -* (0, 0) a lo largo de la recta y = mx. £Es posible definir /(0,0) de modo que / 
sea continua en (0,0)? 

7. Sea f(x, y) = 0 si y < 0 o si y > x 2 y sea /(x, y) = 1 si 0 < y < x 2 . Demostrar que 
fix, y)~*0 cuando (x, y) —> (0,0) a lo largo de cualquier recta por el origen. Hallar 
una curva que pase por el origen a lo largo de la cual (salvo en el origen) fix, y) tiene 
el valor constante 1. i.Es f continua en el origen? 

8. Si fix, y) = [sen (x 2 + y 2 )]/(x 2 + y 2 ) cuando (x,y) 9* (0,0) icomo debe defmirse /(0,0) 
para que sea / continua en el origen? 

9. Sea / un campo escalar continuo en un punto a interior a un conjunto S de R”. Si 
f(a) 0, demostrar que existe una n-bola B(a) en la que f tiene el mismo signo que /(a). 


8.6 La derivada de un campo escalar respecto a un vector 

Esta seccion introduce las derivadas de campos escalares. En la seccion 8.18 
se discuten las derivadas de campos vectoriales. 

Sea / un campo escalar definido en un conjunto S de R", y sea a un punto 
interior a S. Deseamos estudiar la variacion del campo cuando nos desplazamos 
desde a a un punto proximo. Por ejemplo, supongamos que /(a) es la tempera- 
tura en un punto a en una habitacion con calefaccion y con una ventana abierta. 
Si nos movemos hacia la ventana la temperatura decrecera, pero si nos acercamos 
al radiador de la calefaccion aumentara. En general, la variacion del campo de¬ 
pended de la direccion en la que nos movamos a partir de a. 

Supongamos que se representa esa direccion mediante otro vector y. Esto 
es, supongamos que nos movemos desde a hacia otro punto a + y, siguiendo el 
segmento de recta que une a con a -f j. Cada punto de este segmento tiene la 
forma a + hy, donde h es un numero real. En la figura 8.3 se muestra un ejem¬ 
plo. La distancia desde a hasta a + hy es||/ty|| = \h\ ||^j|. 



Figura 8.3 El punto a + hy esta en la Figura 8.4 El punto a + hy estd 
recta paralela a a que pasa por y, n-bola B(a; r) si \\hy\\ < r. 


en la 
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Puesto que a es un punto interior de S, existe una n-bola B(a; r) situada en- 
teramente en S. Si h se elige de manera que |A| ||j>|| < r, el segmento desde a 
hasta a + hy estara en S. (Ver figura 8.4) Mantengamos h ¥= 0 pero lo bastante 
pequeno para que a + hy e S y construyamos el cociente de diferencias 

(8.3) /(a + hy) - /(g) 

h 

El numerador de este cociente pone de manifiesto el cambio de la funcion cuando 
nos desplazamos desde a a a + hy. El cociente se denomina a su vez el prome- 
dio de variacion de / en el segmento de recta que une a con a + hy. Nos inte- 
resa el comportamiento de ese cociente cuando h -»0. Esto nos lleva a la siguiente 
definicion. 


DEFINICION DE LA DERIVADA DE UN CAMPO ESCALAR RESPECTO A UN VECTOR. 
Dado un campo escalar f: S > R , donde Sc R‘. Sean a un punto interior a S 
e y un punto arbitrario de R”. La derivada de f en a con respecto a y se repre- 
senta con el simbolo f'(a;y) y se define 


(8.4) 


f\a\y) = lim 

ft-> o 


f(a + hy) -/(g) 
h 


cuando tal limite existe. 

ejemplo 1. Si y = O, el cociente de diferencias (8.3) es 0 para todo h¥= 0, 
asi que f'( a l O) existe siempre y es igual a 0. 

ejemplo 2. Derivada de una transformacion lineal. Si /: S-+R es lineal, 
entonces f(a + hy) = /(g) + hf(y) y el cociente de diferencias (8.3) es igual a 
/O') para todo h=£ 0. En este caso, f'(a\y) existe siempre y esta dada por 

f( a iy) =f(y) 

para todo a de S y todo y de R" . Dicho de otro modo, la derivada de una trans¬ 
formacion lineal respecto a y es igual al valor de la funcion en y. 

Para estudiar el comportamiento de / sobre la recta que pasa por g y a + y 
para y ^ O introducimos la funcion 

g( 0 =/(« + ty). 

El teorema que sigue relaciona las derivadas g'lt) y f'(a + ty; y). 
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teorema 8.3. Si g(t) = f(a + ty) y si una de las derivadas g(t) of'(a+ty;y) 
existe, entonces tambien existe la otra y coinciden, 

(8.5) g’(0 =/’(« + ty;y). 

En particular, cuando t = 0 tenemos g'(O) = f'(a;y). 

Demostracidn. Formando el cociente de diferencias para g, tenemos 

g(t -4- h) - g(t) _ f(a + ty + hy) - f(a + ty) 
h h 

Haciendo que h -» 0 obtenemos (8.5). 

ejemplo 3. Calcular f'(a,y ) si f(x) = ||x|| 2 para todo x en R n . 

Solucion. Pongamos g(t) = /(« + ty) = (a + ty) ■ (a + ty) = a ■ a + 2ta ■ y 
+ t 2 y ■ y. Por consiguiente g'(t) = 2a • y + 2ty ■ y, asi que g'(0) = f{a ; y) = 
2a- y. 

Un corolario sencillo del Teorema 8.3 es el teorema del valor medio para 
campos escalares. 

TEOREMA 8.4. TEOREMA DEL VALOR MEDIO PARA DERIVADAS DE CAMPOS 
escalares. Supongamos que existe la derivada f’(a + ty;y) para cada t en el 
intervalo 0 < t < 1. Entonces para un cierto numero real 9 en el intervalo abierto 
0 < 9 < 1 tenemos 

f(a + j>) —f(a) =f(z;y), donde z = a + By. 

Demostracidn. Pongamos g(t) = /(a + ty) . Aplicando el teorema del valor 
medio uni-dimensional a g en el intervalo [0, 1] tenemos 

<?(!) — g(0) = g’(6), donde 0 < d < 1. 

Puesto que g(l) - g(0) = /(« + y) -f (a) y g’(9) = /'(« + Oy;y), esto com- 
pleta la demostracidn. 

8.7 Derivadas direccionales y derivadas parciales 

En el caso particular en el -que y es un vector unitario, esto es, cuando 
llj’ll = 1»la distancia entre a y a + hy es \h\. En tal caso el cociente de diferen- 
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cias (8.3) representa el promedio de variation de / por unidad de distancia a lo 
largo del segmento de recta que une a con a + hy; la derivada f'(a;y) se deno- 
mina derivada direccional. 


DEFINICION DE DERIVADAS DIRECCIONAL Y PARCIAL. Si y es UK Vector Uni- 
tario, la derivada f'(a;y) se llama la derivada direccional de { en a en la direc- 
cion de y. En particular, si y — e k (el k-esimo vector coordenado unitario) la 
derivada direccional f'(a-,e k ) se denomina derivada parcial respecto a e k y se 
representa tambien mediante el simbolo Dkf(d). Asi pues 

D k f(a)=f(a-e k ). 


Las siguientes notaciones se usan tambien para la derivada parcial D*/(a): 

^kf ,. • • , a n ), ~ (a k , ..., a n ) , y f > * • • > ^n) • 

ox k 

Algunas veces la derivada f xk se escribe sin el apice f Xk , o incluso mas sencilla- 
mente fk. 

En R 2 los vectores coordenados unidad se designan por /' y j. Si a = (a, b) 
las derivadas parciales /'(a; /') y f'(a;j) tambien se escriben 

f(a,b), 

dy 

derivadas parciales D k f(a),D 2 i(a), 


d £(a,b) y 
ox 

respectivamente. En R 3 , si a = (a, b, c) las 
y D 3 f(a ) se expresan poniendo 


— (a, b, c ), 
ox 


— (a, b, c), 

dy 


y *j-(a,b,c). 

oz 


8.8 Derivadas parciales de orden superior 

La derivation parcial origina nuevos campos escalares DJ ,.... D„f a partir 
de un campo escalar dado f. Las derivadas parciales de D t f,..., D„f se llaman 
derivadas parciales de segundo orden de /. Para funciones de dos variables exis- 
ten cuatro derivadas parciales de segundo orden, que se escriben asi: 


Dk(DJ) = 


ay 

3x 2 ’ 


Dk(DJ) = 


a 2 / 

dx dy 


D 2 (DJ) = 


a 2 / 

dy dx 


a 2 / 

D 2 (D 2 f ) = 

dy 
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Observese que D,(D 2 /) significa la derivada parcial de D 2 f respecto a la primera 
variable. Algunas veces utilizamos la notation DiJ para indicar la derivada par¬ 
cial £),(£>,/). Por ejemplo, D u2 f = D 2 iD.J). Tambien utilizamos la notation 

a 2 / = Am 

By dx By \5x/ 

Esta puede ser o no igual a la otra derivada parcial mixta, 

d2 f _ d (Bf\ 
dx By Bx \ByJ 

£n la seccion 8.23 demostraremos que las dos derivadas parciales mixtas D,(D 2 /) 
y D 2 (D,/) son iguales en un punto si una de ellas es continua en un entorno del 
punto. Tambien la seccion 8.23 contiene un ejemplo en el que D,(D 2 f) ¥= D 2 {Df) 
en un punto. 


8.9 Ejercicios 


1. Un campo escalar / esta definido en R” mediante la ecuacion fix) = a ■ x, donde a es 
un vector constante. Calcular fix ; y) cualesquiera que sean x c y. 

2. a) Resolver el ejercicio 1 cuando / (x) = ||x|| 4 * 6 . 

b) Tomar n = 2 en a) y hallar todos los puntos (x, y) para los cuales f' (2/ + 3/; xi + 
yj) =6. 

c) Tomar n = 3 en a) y hallar todos los puntos (x, y, z) para los cuales/ (i + 2 j + 3 k\ 
xi + yj + zk) = 0 . 

3. Sea T:R"—>R"una transformation lineal dada. Calcular la derivada f'(x\y) para el 
campo escalar definido en R" mediante la ecuacion f(x) = x ■ T(x). 

En cada uno de los ejercicios del 4 al 9, calcular todas las derivadas parciales de primer 
orden del campo escalar dado. En los ejercicios 8 y 9 los campos estan definidos en R". 


4. f(x, y) = x 2 + y 2 sen (xy). 

5 .f(x,y) = Vx 2 +/. 

6. f(x, y) = - X - , (*, y ) ^ (0, 0). 

V* + / 


x + y 

7. f(x,y) = j— x*y. 

8. f(x) — a x , a fijo. 

n n 

9. f (x) 2 2 OtjXiXj , = Qjt. 

•=i i=l 


En cada uno de los ejercicios del 10 al 17, calcular todas las derivadas parciales de primer 
orden. En los ejercicios 10, 11 y 12 comprobar que las derivadas parciales mixtas Di(D 2 f) y 
£> 2 (Dif) son iguales. 


10. f{x,y) =x i + / - 4x 2 y 2 . 14. f(x,y) = arctan (y/x ), * * 0. 


11. f(x,y) = log (x 2 + /), 

1 

12. f(x,y) = - cos x 2 , y 

13. fix, y) = tan (x 2 /y), 


ix,y) * (0,0). 15. fix, y) = arctan , 

1 — xy 

^0. 16. fix,y) = x 1 *' 2 ', x > 0. 

y ** 0. 17. fix, y) = arccos sjxjy , 


xy * 1. 


y # 0. 
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18. Sea v(r,t) = t n e^ lun . Hallar un valor de la constante n tal que v satisfaga la siguiente 
ecuacion: 

if = LL( r i^\ 

dt r 2 3r\ dr) 

19. Dadaz = u(x, y)e ax+bv y ffu/dx dy) = 0. Hallar valores de las constantes a y b tales 
que 

d 2 z dz dz 

-1- IT + 2 = 0 . 

dxdy dx dy 

20. a) Suponer que /'(*; y)= 0 para todo x en una cierta n-bola B{a) y para todo vector y. 
Utilizar el teorema del valor medio para demostrar que / es constante en B(a). 

b) Suponer que f'(x; y)= 0 para un vector fijo y y todo x en B{a). iQue puede decirse 
de / en este caso? 

21. Un conjunto S de R" se llama convexo si para todo par de puntos a y b de S 
el segmento de recta que une a con b pertenece tambien a S; dicho de otro modo, 
ta + (1 — t)be S para cada t del intervalo 0 < t < 1. 

a) Demostrar que toda n-bola es convexa. 

b) Si f'(x;y)= 0 para todo x en un conjunto convexo abierto S y todo y de R", de¬ 
mostrar que / es constante en S. 

22. a) Demostrar que no existe un campo escalar / tal que /' (a ; y) >0para un vector 
fijo a y todo vector no nulo y. 

b) Dar un ejemplo de un campo escalar f tal que f(x l ,y) >Q para un vector fijo y y todo 
vector x. 


8.10 Derivadas direccionales y continuidad 

En la teoria uni-dimensional, la existencia de la derivada de una funcion / 
en un punto implica la continuidad en aquel punto. Esto se demuestra facilmente 
eligiendo un h ¥= 0 y escribiendo 

f{a + h)~ f(a) = f - {a + h) h. 

h 

Cuando h 0 el segundo miembro tiende al lfmite f{a) • 0 = 0 y por tanto 
f(a + h) -» f(a). Esto prueba que la existencia de f’(a) implica la continuidad de 
/ en a. 

Supongamos que aplicamos el mismo razonamiento a. un campo escalar ge¬ 
neral. Supongamos que existe la derivada f'(a;y ) para un cierto y. Entonces si 
h 0 podemos escribir 


/(« + hy) -/(«) = f(a + y /(g) - h. 

h 
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Cuando h 0 el segundo miembro tiende al h'mite /'(a; y) ■ 0 = 0; luego la 
existencia de f(a;y) para un y dado implica que 

lim/(a + hy) = /(a) 

ft-o 

para el mismo y. Esto significa que /(jc)-—/(a) cuando x — a a lo largo de la 
recta de direccion y que pasa por a . Si f'{a\y) existe para todo vector .y, entonces 
/(x) -—/(a)cuando x -*■ a a lo largo de toda recta que pase por a. Esto parece su- 
gerir que / es continua en a. Sin embargo, sorprende que esta conclusion no es 
necesariamente cierta. El ejemplo que sigue muestra un campo escalar que tiene 
derivada direccional en O en cualquier direccion pero que no es continuo en O. 

ejemplo. Sea / el campo escalar definido en R 2 del modo siguiente: 

/(*,JO = ~i y : 4 si * ^ 0, /(0,,y) = 0. 

x + y 

Sea a = (0, 0) e .y = (a, b ) cualquier vector. Sifl#0y/i^0 tenemos 

/(a + hy) - /(a) = f(hy) - /(Q) = f(ha, hb) _ ab 2 

h h h a 2 + hV' 

Haciendo que h -* 0 encontramos f(0;y ) = b 2 /a. Si = (0, b) encontramos, en 
forma parecida, que f(0;y) = 0. Por consiguiente f’(0; >0 existe para todas las 
direcciones j. Tambien, f(x) ->■ 0 cuando x -*• O a lo largo de cualquier recta que 
pase por el origen. Sin embargo, en cada punto de la parabola x = y 2 (excepto 
en el origen) la funcion / tiene el valor J. Puesto que existen tales puntos tan 
proximos al origen como queramos y que f(0 ) = 0, la funcion / no es continua 
en O. 

El ejemplo anterior prueba que la existencia de todas las derivadas direccio- 
nales en un punto no implican la continuidad en el. Por esta razon, las deriva¬ 
das direccionales no constituyen una extension satisfactoria del concepto uni¬ 
dimensional de derivada. Existe una generalizacion mas conveniente que implica 
la continuidad y, al propio tiempo, nos permite extender los principals teoremas 
de la teoria de la derivacion en una dimension al caso de mayor numero de 
dimensiones. Esa es la llamada diferencial total o simplemente diferencial. 

8.11 La diferencial 

Recordemos que en el caso uni-dimensional una funcion / que tiene deri¬ 
vada en a puede ser aproximada en un enlorno de a mediante un polinomio de 
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Taylor de primer grado. Si existe f\a) designemos con E(a, h) la diferencia 


(8.6) E(a, h) = f(a + k) f(a) -f'{a) si h* 0. 

h 

y definamos E(a, 0) = 0. De (8.6) obtenemos la formula 
f(a + h) — f (a) +f'(a)h + hE(a, h), 

valida tambien para h = 0. fista es la formula de Taylor de primer orden para 
aproximar f(a + h) — f(a) por .medio de f(a)h. El error cometido es hE(a, h ). 
De (8.6) resulta que E(a, h) -> 0 cuando h -> 0. Por consiguiente el error hE(a, h) 
es de orden menor que h para valor pequenos de h. 

Esta propiedad de aproximar una funcion diferenciable mediante una fun- 
cion lineal sugiere un metodo de extender el concepto de diferenciabilidad al 
caso de un numero cualquiera de dimensiones. 

Sea f: S -* R un campo escalar definido en un conjunto S de R n . Sean a 
un punto interior a S y B( a; r) una n-bola contenida en S. Sea v un vector tal que 
||»|| < r, de modo que a + v e B(a; r ). 

definicion de campo escalar diferenciable. Decimos que f es dife¬ 
renciable en a si existe una transformacion lineal 

T a : R”->R 

de R” en R, y una funcion escalar E{a, ») tal que 

(8.7) f{a + ») =/(«) 4- T a (v) + ||»|| E{a, v), 

para ||»|| < r de manera que E{a, »)-*0 cuando\\iv\\ ->-0.La transformacion lineal 
T a se llama diferencial de f en a. 

Observacidn: La diferencial T„ es una transformacidn lineal, no un numero. 
El valor T»(») es un numero real; esta definido para todo punto v de R". La dife¬ 
rencial fue introducida por W. H. Young en 1908 y por M. Frechet en 1911 en forma 
mas general. 

La ecuacion (8.7), valida para |M| <r, se llama formula de Taylor de 
primer orden para /(« + tt). Nos proporciona una aproximacion lineal, T a (v), para 
la diferencia/(« + v) - f(a). El error en la aproximacion es ||v|| E{a, v), que es 
de orden mas pequeno que ||»[| cuando ||»|| -* 0 ; esto es, E(a, v ) = o(||»||) cuando 

Ml-o. 
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El teorema que sigue demuestra que si la diferencial existe, es unica. Asi- 
mismo nos dice como calcular T a (y) para todo y de R". 

teorema 8.5. Si f es diferenciable en a con diferencial T a , entonces existe 
la derivada f\a;y ) para todo y de R“ y tenemos 

(8.8) T a (y) =f'(a;y). 

Ademds, f(a;y) es una combinacion lineal de los componentes de y. Efectiva- 
mente, si y = (y t ,.... y n ), tenemos 

(8.9) /'(« =i DJ{a)y k . 

*=1 

Demostracidn. La ecuacion (8.8) es trivial si y — O puesto que T a (0) = 0 
y f(a; O) — 0. Por consiguiente podemos suponer que y ^ O. 

Puesto que / es diferenciable en a tenemos una formula de Taylor, 

(8.10) /(« + v) =/(«) + 7» + || a|| E(a, v) 


para ||v|| < r para algun r > 0, y donde E(a, v) -» 0 cuando ||»|| -> 0. En esta 
formula tomemos v = hy, siendo h # 0 y \h\ ||j|| < r. Entonces ||a|| < r. 
Puesto que T a es lineal es T a {v) = T a (hy ) = hT a (y). Por lo tanto (8.10) nos da 


( 8 . 11 ) 


f(a + hy ) - f{a) 


= TJy) + 


\h\ 


' E(a, v). 


Ya que ||o|| -> 0 cuando h -* 0 y ya que \h\fh = ±1, el segundo miembro de 

(8.11) tiende al limite T a (y) cuando h -> 0. Por consiguiente el primer miembro 
tiene el mismo limite. Esto demuestra (8.8). 

Para deducir (8.9) utilizamos la linealidad de T a . Si j = (y lt . ... y„) tene¬ 
mos y =^ k=1 y k e k ,luego 

T a(y) = T 0 (z - i y k T a (e k ) = i yj'(a ; e k ) = J y k DJ(a). 

\ k =1 / *=1 4=1 


8.12 Gradiente de un campo escalar 

La formula del teorema 8.5, que expresa f'(a;y ) como una combinacion 
lineal de los componentes de y , puede escribirse como un producto escalar, 

f’(a-y) = 2 D k f(a)y k — Vf(a) ■ y, 

k =1 
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donde V/(a) es el vector cuyos componentes son las derivadas parciales de / en a, 

Vf(a) = (D 1 f(a),...,D n f(a)). 

Este es el llamado gradiente de /. El gradiente V / es un campo vectorial definido 
en cada punto a en el que existen las derivadas parciales DJia),.. ., 
Tambien empleamos la notation grad / en lugar de V/. El simbolo V se lee 
«nabla». 

La formula de Taylor de primer orden (8.10) puede ahora escribirse en 
la forma 

(8.12) f(a + v) =/(«) + V/(«) • v + ||i>|| E(a, v), 

en donde E(a, v) 0 cuando ||»|| -> 0. En esta forma se parece a la formula de 
Taylor unidimensional desempenando el vector gradiente V/(a) el papel de la de- 
tivada /'(«)- 

A partir de la formula de Taylor podemos deducir facilmente que la diferen- 
ciabilidad implica la continuidad. 

teorema 8.6. Si un campo escalar f es diferenciable en a, entonces f es con- 
tinua en a. 

Demostracidn. De (8.12) resulta 

\f(a + e) — /(a) | = |V/(a) • v + M E(a, r)|. 

Aplicando la desigualdad triangular y la de Cauchy-Schwarz encontramos 
0 < I/(« + r) - f(a )| ^ ||V/(«)|| ||»|| + IMI I E(a, »)|. 



Figura 8.5 Relacion geom&trica de la derivada direccional con el vector gradiente. 
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Esto demuestra que f(a + t>)-*/(«) cuando ||»]| ->0, asf que ft s continua en a. 

Cuando y es un vector unitario la derivada direccional f'(a;y ) tiene una sen- 
cilia relacion geometrica con el vector gradiente. Supongamos que V/(a) # O 
y designemos con 6 el angulo formado por V/(a) e y . Tenemos entonces 


f'(a;y) = V/(«) • y = ||V/(a)|| \\y\\ cos 0 = ||V/(a)|| cos 6. 


Esto nos dice que la derivada direccional es el componente del vector gradiente 
en la direccion del La figura 8.5 muestra los vectores V/(a) e j aplicados al 
punto a. La derivada alcanza el valor maximo cuando cos 6 = 1, esto es, cuando 
y tiene la misma direccion que V/(a). Ademas, este maximo es igual a la longi- 
tud del vector gradiente. Cuando V/(a) es ortogonal a y, la derivada direccional 
f{a\y)t s 0. En el espacio de dos dimensiones se escribe con frecuencia 


V/(x, y) 


df(x, y) . , df(x, y) . 

- | J-i 

dx dy 


En tres dimensiones la formula correspondiente es 


v/d,,, 2) « i + m-hllj + ffiiZii) t . 


dx 


dy 


dz 


8.13 Condicion suficiente de diferenciabilidad 

Si / es diferenciable en a, existen todas las derivadas parciales D x f(a ),. . . , 
D n f(d). No obstante, la existencia de todas esas derivadas no implica necesaria- 
mente que / sea diferenciable en a. La siguiente funcion proporciona un contra- 
ejemplo 

xv 2 

f{x,y) = ——- si X 5 * 0 , f(0,y) = 0, 

x + y 

que ya se discutio en la seccion 8.10. Para esa funcion existen las dos derivadas 
parciales i)j/(0) y D^O) pero / no es continua en O, y por tanto no puede 
ser diferenciable en 0. 

El teorema que sigue demuestra que la existencia de derivadas parciales 
continuas en un punto implica la diferenciabilidad en dicho punto. 

TEOREMA 8.7. CONDICION SUFICIENTE DE DIFERENCIABILIDAD. Si existen 
las derivadas parciales D\f ,..., D n f en una cierta n-bola B(a) y son continuas 
en a, entonces f es diferenciable en o. 
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Observacidn: Un campo escalar que satisfaga las hip6tesis 8.7 se le llama 
diferenciable con continuidad en a. 

Demostracidn. T a (») solo puede ser V/(a) • v . Queremos demostrar que 

/(« + v) - /(a) = V/(a) • v + M E(a, v), 

donde E(a, v)~* 0 cuando ||v|| 0. Esto probara el teorema. 

Pongamos A = ||»||. Entonces v = hi, donde [|w|| = 1. Mantengamos A lo 
bastante pequeno para que a + v este en la bola B(a) en la que existen las deri- 

vadas parciales Dj/. D„f. Expresando u en funcion de sus componentes 

tenemos 


u = Ul e x + • • • + u n e n , 

donde e lt ... ,e n son los vectores coordenados unitarios. Escribamos ahora la di- 
ferencia f(a + ») — /(«) en forma de suma telescopica, 


(8.13) 


n 


f(a + ») - f(a ) = /(a + A«) - /(a) = 2 {/(« + - f(a + HH}. 

fc=l 


en la que i> 0 ,» 1( ..., v n son vectores cualesquiera de R” tales que v g = O y v n — u. 
Elijamos esos vectores de modo que satisfagan la relacion de recurrencia 
v k = v k _ 1 4 - u k e k . Esto es, tomemos 

v 0 =O, »i = n 1 e 1 , v 2 = u 1 e 1 + u 2 e 2 , ..., v n = + ■ ■ ■ + u n e n . 

Entonces el /c-esimo termino de la suma (8.13) se transforma en 

f(a + H-i + Xu k e k ) —f(a + Ad^j) =f{b k + ?.u k e k ) - f(b k ), 

donde b k = a + Xv k _ k . Los dos puntos b k y b k + /.u k e k tan solo difieren en su 
fc-esimo componente. Por consiguiente podemos aplicar el teorema del valor 
medio del calculo diferencial y escribir 

;8.14) f(b k + Xu k e k ) - f{b k ) = Xu k D k f(c k ), 

perteneciendo c k al segmento de recta que une b k a b k + Au k e k . Observese que 
b k -► a y por tanto c k a cuando A -» 0. 

Aplicando (8.14) en (8.13) obtenemos 


n 


f(a + v) -f(a) = A 2 D k f(c k )u k . 

k =1 
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Pero V/(a) • v = A V/(«) ■ u — X 2Li A/(«K > aS1 ' <l ue 

/(a + ») - /(a) - V/(a) • v = A2(D*/(c*) - D k f(a)}u k = ||v|| £(«, r), 

A=1 

donde 

£(«, ») = 2 { D kf( c k) ~ D k f(a)}u k . 

k=l 


Puesto que c k -+a cuando ||»|| 0 , y puesto que cada derivada parcial Dkf es 

continua en a„ vemos que E(a, v) -> 0 cuando ||»|||-* 0. Esto completa la deknos^- 
tracion. 

8.14 Ejercicios 


1. Hallar el vector gradiente en cada punto en el que exista para los campos escalares de- 
finidos por las ecuaciones siguientes: 

a) f(x,y) - x 2 + y 2 sen (xy) . d ) f(x,y,z) = x 2 - y 2 +2z 2 . 

b) f(x, y) = e x cos y . e) fix, y, z) = log (x 2 + 2 y 2 - 3 z 2 ). 

c ) fix, y,z) = x 2 y 3 z l . f) f(x, y, z) = x v ’. 

2. Calcular las derivadas direccionales de los siguientes campos escalares en los puntos 
y direclciones que se indican: 

a) f(x,y,z) = x 2 + 2f + 3z* en (1,1,0) en la direccion de » —j + 2k. 

b) f(x,y,z ) = (x/yY en (1,1,1) en la direccion de 2 i + j — k. 

3. Hallar los puntos (x,y) y las direcciones para las que la derivada direccional de 
f(x,y) — 3x ! + y 1 tiene el valor maximo, si (x, y) esta eh el circulo x 1 + y 2 — 1. 

4. Un campo escalar diferenciable / tiene, en el punto (1,2) las derivadas direccionales 
+2 en direccion al punto (2,2) y —2 en direccion al punto (1,1). Determinar el vector 
gradiente en (1,2) y calcular la derivada direccional en direccion al punto (4,6). 

5. Hallar los valores de las constantes a, b y c tales que la derivada direccional de 
fix, y,z) = axy 1 + byz + cz 2 x 3 en el punto (1,2, —1) tenga el valor maximo 64 en la 
direccion paralela al eje z. 

6. Dado un campo escalar diferenciable en un punto a de R 2 . Supongamos que f ia\y) = 1 
y /'(«; z) =2, siendoy =2 i + 3j y Z = « +j. Hacer un grafico mostrando el conjunto 
de todos los puntos (x, y) para los que f'(a\ xi + yj) = 6. Calcular tambien el gra¬ 
diente V/(a). 

7. Sean j y g dos campos escalares diferenciables en un conjunto abierto S. Deducir las 
siguientes propiedades del gradiente: 

a) grad f = O si / es constante en S. 

b) grad (/ + g) == grad / + grad g. 

c) grad icf) = c grad / si c es constante. 

d) grad (/g) = / grad g + g grad f. 


e) 


grad 



g grad/— /grad g 
g 2 


en los puntos en los que g # 0. 


8. En R 3 consideremos r{x,y,z) - xi + yj +zk, y sea r(x,y,z) = \\r(x, y, z)\\. 
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a) Demostrar que Vr(x, y, z) es un vector unidad en la direction de r (x, y, z). 

b) Demostrar que V (r") = nr”~ 2 r si n es un entero positivo. 

[ Indicacion: Utilizar el ejercicio 7 d).] 

c) iEs valida la formula del apartado b) cuando n es entero negativo o cero? 

d) Hallar un campo escalar / tal que V/ = r. 

9. Supongamos que / es diferenciable en cada punto de una n-bola B(a). Si f (x; y) =0 
para n vectores independientes y lt . . . , y n y para todo x en B{a), demostrar que / es 
constante en B(a). 

10. Supongamos que / es diferenciable en cada punto de una n-bola B{a). 

a) Si V f(x) — 0 para todo x de B(a), demostrar que / es constante en B(a). 

b) Si f(x) < f(a) para todo x d eB(a), demostrar que V/(a) = 0. 

11. Considerar las seis proposicionesque siguen relativas a un campo escalar f:S —> R, siendo 
S £ R” y a un punto interior a S. 

a) f es continuo en a. 

b) / es diferenciable en a. 

c) /' ( a ; >■) existe para todo de R”. 

d) Existen todas las derivadas parciales de f en un entomo de a y son continuas en a. 

e) V/(«) = 0. 

f) f(x) = ||x — «|| para todo x de R\ 


En una tabla parecida a la indicada aqui, 
marcar con una T el cuadrado correspondiente 
si la proposicion de la fila (x) implica siempre 
la proposicion de la columna (y). Por ejemplo, 
si (a) implica siempre (b), poner T en el se- 
gundo cuadrado de la primera fila. La diagonal 
principal ha sido ya marcada. 



a 

b 

c 

d 

e 

f 

a 

T 






b 


T 





c 



T 




d 




T 



e 





T 


f 






T 


8.15 Regia de la cadena para derivadas de campos escalares 

En la teoria de la derivacion en una dimension, la regia de la cadena nos 
permite calcular la derivada de una funcion compuesta g(f) = f[r(t)] mediante 
la formula 


g\t)=f'Wt)]-r\t). 

Esta seccion nos proporciona una extension de la formula cuando / se reemplaza 
por un campo escalar definido en un conjunto del espacio de dimension n,y r 
por una funcion vectorial de una variable real cuyos valores estan en el domi- 
nio de /. 
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Mas adelante extenderemos aun mas la formula para incluir el caso en el 
que / y r son ambas campos vectoriales. 

Resulta facil imaginarse casos en los que puede presentarse la composition 
de un campo escalar y un campo vectorial. Por ejemplo, supongamos que f(x) 
mide la temperatura en un punto x de un solido tri-dimensional, y supongamos 
que queremos conocer como cambia la temperatura cuando el punto x se mueve 
a lo largo de una curva C situada en el solido. Si la curva es descrita por una 
funcion vectorial r definida en un intervalo [a, b], podemos introducir una 
nueva funcion g mediante la formula 

s(0=/lr(0] si a<t<b. 

Esta funcion compuesta g expresa la temperatura como funcion del parametro 
t, y su derivada g’(t) mide la variacion de la temperatura a lo largo de la curva. 
La siguiente extension de la regia de la cadena nos permite calcular la derivada 
g '(0 sin determinar g(t) explicitamente. 

teorema 8.8. regla de la cadena. Sea f un campo escalar dejinido en 
en un conjunto abierto S de R", y sea r una funcion vectorial que aplica un 
intervalo J de R 1 en S. Definamos la funcion compuesta g =f ° r en f mediante 
la ecuacion 


g(t) = f[r(t)] si teJ. 

Sea t un punto de J en el que r'(t) existe y supongamos que f es diferenciable en 
r(t). Existe entonces g'(t) y es igual al producto escalar 

(8.15) g\t) = V/(a) • r’(t), donde a„=r(t). 

Demostracion. Pongamos a = r(t), siendo t un punto de / en el que 
r'(t) exista. Puesto que S es abierto existe una n-bola B(a) situada en S. Tomemos 
h ¥= 0 lo bastante pequeno para que r(t + h ) este situada en B{a), y pongamos 
= r(t + hi) — r(t). Observese que y -+ O cuando h -» 0. Tenemos ahora 

go + h )~ i(0 =f\r(t + h)] -f[r(t)] =f(a + y) -/(«). 

Aplicando la formula de Taylor de primer orden a / tenemos 

/(« + T) -/(«) = V/(a) • y + ||,y|| E(a,y), 

donde E(a,y)-+ 0 cuando lb'll -*-0. Ya que = r(t + h) — r(t)esto nos da 

g(t +h)~ g(t) = v/(<j) . r(t + h)~ r(t) + ||r(t + h) - r(Q|| £( ^ 

h h h 
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Haciendo que h -> 0 obtenemos (8.15). 

ejemplo 1. Derivada direccional a lo largo de una curva. Cuando la fun- 
cion r describe una curva C, la derivada r' es el vector velocidad (tangente a 
la curva) y la derivada g' de la ecuacion (8.15) es la derivada de / respecto al 
vector velocidad, suponiendo que r'^= O. Si T(t) es un vector unitario en la 
direccion de r'(t) (T es el vector tangente unitario), el producto escalar 
Y/WO]' T(t) se llama derivada direccional de f a lo largo de la curva C o en la 
direccion de C. Para una curva plana podemos escribir 

T(t ) = cos a(t) i + cos , 

siendo a(t) y /3(0 los angulos formados por el vector T (t) y los ejes x e y posi¬ 
tives; la derivada direccional de / a lo largo de C es en este caso 

Y/MO] • T(t) = D x f[r{t )] cos a(f) + D 2 f[r{t )] cos p(t). 

Con frecuencia esta formula se escribe mas simplemente asi: 

V/' T = — cos a + — cos ft. 
ox 3 y 

Algunos autores expresan la derivada direccional V/-J. con el simbolo d//ds. 
Puesto que la derivada direccional a lo largo de C esta definida en funcion de J, 
su valor depende de la representacion parametrica elegida para C. Un cambio de 
la representacion podria invertir la direccion de T; lo que, a su vez, invertira 
el signo de la derivada direccional. 

ejemplo 2. Hallar la derivada direccional del campo escalar f(x, y) = 
= * 2 - 3xy a lo largo de la parabola y = x 2 - x + 2 en el pun to (1,2). 

Solucidn. En un punto cualquiera (x, y) el vector gradiente es 
Y fix, y) = + ~j = (2x - 3 y)i - 3 xj. 


En el punto (1,2) tenemos V/(l,2) = — 4/ — 3 j. La parabola puede represen- 
tarse parametricamente mediante la ecuacion vectorial r(t) = ti + (t 2 — t + 2)j 
Por lo tanto, r(l) = i + 2 j, r'(t) = i + (2 1 - 1 )j,y r '(\) = / + j. Para esta re¬ 
presentacion de C el vector unitario tangente T (1) es (i + j)/V2 y la derivada di- 
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reccional pedida es V/(l,2)- T(l) = —7/V2. 

ejemplo 3. Sean / un campo escalar no constante, diferenciable en todo 
el piano, y c una constante. Supongamos que la ecuacion cartesiana f(x, y) = c 
describa una curva C que tenga tangente en cada uno de sus puntos. Demostrar 
que / tiene las siguientes propiedades en cada punto de C: 

a) El vector gradiente V/ es normal a C. 

b) La derivada direccional de / es cero a lo largo de C. 

c) La derivada direccional de / tiene su valor maximo en la direccion 
normal a C. 

Solution. Si T es un vector unitario tangente a C, la derivada direccional 
de / a lo largo de C es el producto escalar V/- T. Este producto es cero si 
V/ es perpendicular a T, y alcanza su maximo valor si V/ es paralela a T. 
Por consiguiente las dos proposiciones b) y c) son consecuencias de a). Para 
demostrar a), consideremos una curva plana cualquiera r con una ecuacion vec¬ 
torial de la forma r(t) —X{t)i -f Y(t)j e introduzcamos la funcion g(t) = f[r(t)]. 
En virtud de la regia de la cadena tenemosg'(0 = V/[r(r)] • r'{t). Cuando r = C, 
la funcion g tiene el valor constante c asi que g'(t) = 0 si r(t) e C. Puesto que 
g' = V/- r , resulta que V/ es perpendicular a r' en C; luego V/ es normal a C. 


8.16 Aplicaciones geometricas. Conjuntos de nivel. Pianos tangentes 


La regia de la cadena puede utilizarse para deducir propiedades geometricas 




Figura 8.6 Las curvas de trazos son iso- 
termas: f(x,y) = c. El vector gradiente V/ 
indica la direccidn de las llneas de fuerza. 


Figura 8.7 El vector gradiente V/ es 
normal a cada curva F situada en la super- 
ficie de nivel fix, y, z) = c. 
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del vector gradiente. Sea / un campo escalar definido en un conjunto S de R” y 
consideremos aquellos puntos x de S para los que f(x) tiene un valor constante, 
por ejemplo f(x) = c. Designemos ese conjunto por L(c), de modo que 

L(c) = {x | * e S y f{x) = c}. 

El conjunto L(c) se llama conjunto de nivel de /. En R’, L(c) se llama curva de 
nivel ; en R :1 superficie de nivel. 

En muchas aplicaciones fisicas se presentan familias de curvas de nivel. Por 
ejemplo, si f(x, y) representa la temperatura en ( x, y), las curvas de nivel de / 
(curvas de temperatura constante) se llaman isotermas. El flujo de calor tiene 
lugar en la direccion del cambio mas rapido de la temperatura. Luego, en una 
hoja plana delgada el flujo de calor tiene lugar a lo largo dc una familia de curvas 
ortogonales a las isotermas. Esas se llaman lineas de flujo; son las trayectorias 
ortogonales de las isotermas. Vease la figura 8.6. 

Consideremos ahora un campo escalar / diferenciable en un conjunto abierto 
S de R ;! , y examinemos una de sus superficies de nivel, L(c). Sea a un punto 
en esa superficie, y consideremos una curva r situada en la superficie y que pase 
por a, como esta indicado en la figura 8.7. Demostraremos que el vector gradiente 



Figura 8.8 El vector gradiente V/ es normal al piano tangente a ana superficie de nivel 

fix, y, z) = c. 
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Vf(a) es normal a esa curva en a. Esto es, demostraremos que V/(a) es perpen¬ 
dicular al vector tangente de r en a. A tal fin supongamos que r esta definida para- 
metricamente por una funcion vectorial derivable r definida en un cierto inter¬ 
val / de R 1 . Puesto que r esta situada en la superficie de nivel 1(c), la funcion r 
satisface la ecuacion 


/fr(/)] = c para todo tdeJ. 

Si g(t) = f[r(t)\ para t en /, la regia de la cadena establece que 

Puesto que g es constante en /, tenemos g'(t) = 0 en /. En particular, eligiendo t, 
de modo que g(fj) = a encontramos que 

V/(«) -r\t x ) = 0. 


Es decir, el gradiente de / en a es perpendicular al vector tangente r'fo) como se 
afirmo. 

Tomemos ahora una familia de curvas en la superficie de nivel L(c) que pasen 
por el punto a. Segun lo dicho en la discusion anterior, los vectores tangentes a 
todas esas curvas son perpendiculares al vector gradiente V/(a) , Si este no es cero, 
dichos vectores tangentes determinan un piano, y el gradiente V/(a) es normal a 
este piano. (Vease figura 8 . 8 .) Tal piano se llama piano tangente a la superficie 
L(c) en a. 

En el Volumen I se vio que un piano que pase por a con vector normal N 
esta constituido por todos los puntos x de R 3 que satisfacen la ecuacion 
TV • (x — a) = 0. Por consiguiente el piano tangente a la superficie de nivel L(c ) 
en a estara constituido por todos los puntos x de R 3 que satisfagan 

v /(«) • (x - a) = 0. 

Para obtener una ecuacion cartesiana de ese piano expresaremos x, a, y V/(a) 
en funcion de sus componentes. Escribiendo x = (x,y,z), a = Or,, y,, z,), y 

V/(a) = A/(a)* + D 2 f(a)j + D 3 f(a)k, 


obtenemos la ecuacion cartesiana 

Dif(a)(x - Xl ) + D 2 f(a)(y - y,) + D 3 f(a)(z — z x ) = 0. 
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A los campos escalares definidos en R 2 se aplica una discusion parecida. En el 
ejemplo 3 de la section anterior hemos demostrado que el vector gradiente V/(a) 
en un punto a de una curva de nivel es perpendicular al vector tangente a la 
curva en a. Por consiguiente la recta tangente a la curva de nivel L(c ) en un punto 
a = (*i, j x ) tiene la ecuacion cartesiana 

E>if(a)(x - *i) + D 2 f(d)(y ~ yi ) = 0. 


8.17 Ejercicios 


1. En este ejercicio podemos suponer la existencia y continuidad de todas las derivadas 
que se consideren. Las ecuaciones u-f(x.y), x=X(t), y=Y(t) definen u como funcion 
de t, pongamos u=F(t). 

a) Aplicar la regia de la cadena para demostrar que 

no - f *■« + Sno. 

donde df/dx y df/dy se han calculado en [X(t), Y(01- 

b) En forma parecida, expresar la derivada segunda F"(t) en funcidn de las derivadas 

de /, X e Y. Recuerdese que las derivadas parciales de la formula del apartado a) son 

funciones compuestas dadas por 

a” = DJIXit), Y(/)], d I = D 2 f[X(t), YU)]. 

2. Teniendo en cuenta el ejercicio 1 calcular F'(t) y F"(t) en funcion de t en cada uno de 
los siguientes casos particulares: 

a) f(x,y) = x 2 + /, X(t) = t, Y{t) = tK 

b) f(x,y) = e xv cos (xy 2 ), X(t) = cos /, Y(t) = sen t. 

c) f(x,y) = log [(1 + e* 2 )l(l + e**)), XU) = e, YUY = «“*. 

3. Calcular en cada caso la derivada direccional de / en los puntos y direcciones que se 
indican: 

a) f(x, y, z) = lx - 5y + 2z en (2,2,1) en la direccion de la normal exterior a la 
esfera x 1 + y 2 + z 2 = 9. 

b) f(x, y, z) = x 2 — y 2 en un punto cualquiera de la superficie x 2 + y 2 + z 2 = 4 en la 
direccion de la normal exterior en dicho punto. 

c) /(x, y, z) = x 2 + y 2 — z 2 en (3,4,5) a lo largo de la curva de interseccion de las dos 
superficies 2x 2 -f 2y 2 — z 2 = 25 y x 2 + y 2 = z 2 . 

4. a) Hallar un vector V(x, y, z) normal a la superficie 


z = ^Jx 2 + y 2 + (x 2 + y 2 Y 2 
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en un punto cualquiera (x, y, z) de la superficie (x, y, z) 5* (0, 0, 0). 

b) Hallar el coseno del angulo 9 formado por el vector |/(x, y, z) y el eje z y deter- 

minar el lfmite de cos 6 cuando (x, y, z) -» (0,0,0). 

5. Las dos ecuaciones e' cos v = x y e“ sen v — y definen u y v como funciones de x e y, 
sean estas u = U(x, y) y v — V(x,y). Hallar formulas exph'citas para U(x, y) y V(x, y), 
validas para x > 0, y demostrar que los vectores gradientes Vt/(x,y) y VV(x,y) son 
perpendiculares encada punto (x, y). 

6 . Sea /(x, y) = VRyf. 

a) Comprobar que df/dx y df/dy son cero ambas en el origen. 

b) ^Tiene la superficie z = /(x, y) piano tangente en el origen? [ Indicacidn: Considd- 
rese la section producida en la superficie por el piano x =y.] 

7. Si (xo, yo, zo) es un punto de la superficie z = x y, las dos rectas z = yox, y = yo y 
z = xoy, x = xo se cortan en (xo, yo, zo) y estan situadas en la superficie. Comprobar que 
el piano tangente a esta superficie en el punto (xo, yo, zo) contiene a esas dos rectas. 

8. Hallar la ecuaci6n cartesiana del piano tangente a la superficie xyz = a 3 en un punto 
generico (xo, yo, zo). Demostrar que el volumen del tetraedro limitado por ese piano y 
los tres pianos coordenados es 9a 3 /2. 

9. Hallar un par de ecuaciones cartesianas para la recta que es tangente a las dos super¬ 
ficies x 2 + y 2 + 2z J = 4 y z = e?~ y en el punto (1,1,1). 

10. Hallar una constante c tal que en todo punto de la intersecci6n de las dos esferas 

(x - c) 2 + f + z 2 = 3 y x 2 + (y - l) 2 + z 2 = 1 

los pianos tangentes correspondientes sean perpendiculares el uno al otro. 

11. Si n y n son las distancias desde un punto (x, y) de una elipse a sus focos, demostrar 
que la ecuacion r, + r 2 — constante (que satisfacen esas distancias) implica la relacion 

T V(r x + r 2 ) = 0, 

siendo T el vector unitario tangente a la curva. Interpretar geometricamente ese resul- 
tado, y con ello demostrar que la tangente forma angulos iguales con las rectas que 
unen (x, y) a los focos. 

12. Si V /(x, y, z) es siempre paralela a xi + yj + zk , demostrar que / debe tomar valores 
iguales en los puntos (0,0, a) y (0,0,—a). 


8.18 Diferenciales de campos vectoriales 

La teorfa de la diferenciacion para campos vectoriales es una extension directa 
de la teoria analoga para campos escalares. Sea f:S~>R m un campo vectorial 
definido en un subconjunto S de R'\ Si a es un punto interior de S e y un vector 
cualquiera de R n definimos la derivada f'(a; y) mediante la fbrmula 

/-(«;/)-lim ^ + W — /f * ) , 

h-0 h 

siempre que tal limite exista. La derivada/'(a;>0es un vector de R m . 
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Designemos con /* el &-esimo componente de /. Observemos que la derivada 
f (a; y) existe si y solo si f\ (a; y ) existe para cada k = 1, 2,..., m, en cuyo caso 
tenemos 


m 

f'(a;y) = (ff(a;y),. . . ,fja\y)) = ^fi(a\y)e k , 

k =1 

donde e k es el &-esimo vector coordenado unidad. 

Decimos que / es diferenciable en un punto interior a si existe una transfor¬ 
mation lineal 


T a : R > R‘ 

tal que 

(8-16) /(« + v) —f(a ) + TJv) + ||d || E(a, v), 

dond eE(a, v) -> Ocuando v * O. La formula de Taylor de primer orden (8.16) es 
valida para todo v tal que ||»|| < r para un cierto r > 0. El termino E(a, v ) es un 
vector de R m . La transformacion lineal T a se llama dijerencial total o simple- 
mente diferencial de / en a. 

Para los campos escalares se demostro que T a (y) es el producto escalar del 
vector gradiente V/(«) por y. Para los campos vectoriales demostraremos que 
T a {y) es un vector cuyo componente fc-esimo es el producto escalar V/ i (a) • y. 

teorema 8.9. Supongamos que f es diferenciable en a con diferencial T a . 
Existe entonces la derivada f'(a;y)para todo a de R n , y tenemos 

(8.17) TJy) = f(a; y). 

Ademas, si f = (f u ..., f m ) y si y = (y 1( ..., y„), tenemos 

m 

(8.18) TJy) = J V/ t (a) ye k = (V/,(a)-y,. . ., V/ m («) • y). 

fc=l 

Demostracion. Razonemos como en el caso escalar. Si y = O, entonces 
f\ a >y) = O y T a (0) — O. Por consiguiente podemos suponer que y ^ O. To- 
mando v — hy en la formula de Taylor (8.16) tenemos 

/(« + hy) — f (a) = TJhy) + ||Ay|| E(a, v ) = hTJy) + \h\ ||y|| E(a, v). 

Dividiendo por h y haciendo que h -> 0 obtenemos (8.17). 

Para demostrar (8.18) basta observar que 

f(^y)=l /*(«; y)e k =2 V/ t («) ye k . 



330 


Calculo diferencial en campos escalares y vectoriales 


La ecuacion (8.18) puede tambien escribirse en forma mas sencilla como un 
producto matricial. 


T a (y) = Df{a)y, 


siendo Of (a ) la matriz rtiXn cuya fila fc-esima es Vf k (a), e y una matriz columna 
nXl. La matriz Df(a) se llama matriz jacobiana de'/ en a. Su elemento kj es la 
derivada parcial Djffa). Asf pues, tenemos 


-DJM DJM 
Difiia) D 2 f 2 (a) 


Of (a) = 


D n h(a) 

D n fM) 


\_DJJa) DJJa) ••• DJJd) J 


La matriz jacobiana Of {a) esta definida en cada pun to en el que existan las mn 
derivadas parciales DJ k (a). 

La diferencial T a se expresa tambien poniendo f\a). La derivada f\a) es 
una transformacion lineal; la matriz jacobiana Df(a) es una representacion ma¬ 
tricial de esa transformacion. 

La formula de Taylor de primer orden toma la forma 


(8.19) /(a + v) — /(a) +/'(a)(t>) + ||r|| E(a, v), 

donde E(a, v) ->■ O cuando v —>■ O. Se parece a la formula de Taylor unidimensio¬ 
nal. Para calcular los componentes del vector /'(«)(») podemos utilizar el produc¬ 
to matricial Df(a)v o la formula (8.18) del teorema 8.9. 

8.19 La diferenciabilidad implica la continuidad 

teorema 8.10. Si un campo vectorial f es diferenciable ena, entonces f es 
continuo en a. 

Demostracidn. Como en el caso escalar, aplicamos la formula de Taylor 
para demostrar este teorema. Si hacemos que v O en (8.19) el error 
'1 E (a, v) > O . La parte lineal /'(«)(*’) tiende tambien a O debido a que las 
transformaciones lineales son continuas en O. Esto completa la demostracidn. 

A1 llegar aqui conviene deducir una desigualdad que se utilizara en la de- 
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mostracion de la regia de la cadena en la proxima seccion. La desigualdad se re- 
fiere a un campo vectorial / diferenciable en a; ella establece que 

m 

(8.20) ll/'(«)(»)ll < M / a ) Ml. donde M /(«) = 1 ll v /*.(«)ll • 

fc=l 

Para demostrarla utilizamos la ecuacion (8.18) junto a la desigualdad triangular 
de Cauchy-Schwarz obteniendo 


II/'(«)(*>) II = 


2 v /*(«) • 


k=l 


ve k 


m 


m 


<l\ma)-v\ ^II|V/,(a)|| HI. 

*=i *=i 


8.20 La regia de la cadena para diferenciales de campos vectoriales 

teorema 8.11. regla de la cadena. Sean f y g dos campos vectoriales 
tales que la funcion compuesta h — f g este definida en un entorno del punto a. 
Supongamos que g sea diferenciable en a, con diferencial g'(a). Pongamos b = g(a) 
y supongamos que f es diferenciable en b, con diferencial f'(b). Entonces h es 
diferenciable en a, y la diferencial h'{a) viene dada por 

h'(a)=f'(b)og'(a), 

que es la composicion de las transformaciones lineales f'(b) y g'(a). 

Demostracion. Consideremos la diferencia h{a + j) — A(a)para valores pe- 
quenos de ||j||, y demostremos que se obtiene una formula de Taylor de primer 
orden. De la definicion de h resulta 

(8.21) *(« + j) - h{a) = f[g(a + j)] - f[g{a)] = f(b + v ) -f{b), 

siendo v = g(a + j») — g(a) . La formula de Taylor aplicada a g(a + >’) 
nos da 

(8.22) v = g'(a)(y) -f !|y|| E g (a,y), donde E g (a,y)-^-0 cuando yO . 

La formula de Taylor relativa a f(b + i>)nos da 


( 8 . 23 ) 


f(b + v) -f(b ) =f(h)(v) + Mi E/b, v). 
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donde E/b, v) —► O cuando v —> O. Aplicando (8.22) en (8.23) obtenemos 

(8.24) f{b + v) -f(b) = f\b)g\a)(y) + /'(*)( lb II E g (a,y)) + ||r|| E/b, v) 

= /'(%'(«)b) + lbII E(a,y), 

donde E(a, O) — O y 

(8.25) E(a,y) = f’(b)(E g (a,y)) + E/b, v) si y^O. 


Para completar la demostracion necesitamos probar que£(a, y)-> O cuando y -*■ O. 

El primer termino del segundo miembro de (8.25) tiende a O cuando y~-0 
porque£ (a, j?)->- O cuando O y las transformaciones lineales son continuas 

en O. . 

En el segundo termino del segundo miembro de (8.25) el factor E f (b, v) -+ O 
porque v->-0 cuando y -+ O . El cociente ||w||/lbll permanece acotado porque, 
segun (8.22) y (8.20) tenemos 

lb II < M t (a) lb II + lb II II £■<(«, j) II • 

Por consiguiente los dos terminos del segundo miembro de (8.25) tienden a O 
cuando y -+ O , asi que E(a, y)-+ O. 

De este modo, de (8.24) y (8.21) obtenemos la formula de Taylor 

h(a +y)~ h(a) =f\b)g\a)(y) + |bll E(a,y), 

donde E(a, y) O cuando >> —>- 0. Esto demuestra que h es diferenciable en a 
y que la diferencial h'(a) es igual a la composicion f'(b)°g\a). 

8.21 Forma matricial de la regia de la cadena 


Sea h =fog, donde g es diferenciable en a y / diferenciable en b =g(a). 
La regia de la cadena establece que 

A '(«) =/'(*) °g'(a)- 

Podemos expresar la regia de la cadena en funcion de las matrices jacobianas 
Dh(a), Df{b), y Z)g-(a)que representan las transformaciones lineales h'{a), f\b), 
y S ( a )> respectivamente. Puesto que la composicion de transformaciones lineales 
corresponde a la multiplicacion de sus matrices, obtenemos 

(8.26) Dh(a) — Df(b) Dg(a), donde b—g{a). 
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fista es la llamada forma matricial de la regia de la cadena. Tambien puede es- 
cribirse como un conjunto de ecuaciones escalares expresando cada matriz en 
funcion de sus elementos. 

Supongamos que a e R*, b = g(a) e R n , y f(b) e R m . Entonces h(a) e R m y 
podemos escribir 


8 (gl> ' ' * ' gn) > f (A, • ■ • >/m) ’ 6 (^1, • • • > 6 m ) • 

La matriz Dh(a) es mXp, la matriz Df(b) es «X«, y Dg{a) es una matriz 
nXp, y vienen dadas por 


Dh(a) = [DM*)] 


m, v 
i,j =1 > 


0/(6) = [O,//A)] 


m,n 
i,k= 1 » 


= [D jgk (a)] 


n,p 

k,j=1 • 


La ecuacion matricial (8.26) es equivalente a mp ecuaciones escalares, 

n 

DM") = 2 D kfiW D igk("), Para i = 1, 2,.. ., m y j = 1,2, ... ,p. 

Estas ecuaciones expresan las derivadas parciales de los componentes de h en 
funcion de las derivadas parciales de los componentes de / y g. 

ejemplo 1. Extension de la regia de la cadena para campos escalares. 
Supongamos que / es un campo escalar (m = 1). Entonces h tambien lo es y 
existen p ecuaciones en la regia de la cadena, una para cada una de las derivadas 
parciales de h: 


D M a ) = 2 D k f(b)D jgk (a), para j=l,2,...,p. 

k =1 

El caso particular p — 1 ya se considero en la seccion 8.15. Entonces se tiene la 
unica ecuacion, 


h\a) 


n 


= 2 D k f(b)g k (a). 

k=l 


Consideremos ahora p = 2 y n = 2. Pongamos a = (s, t) y b = (x, y). Los 
componentes x e y estan ligados a s y t por las ecuaciones 


x = gi( s > 0 , y = gi(s, t ). 
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La regia de la cadena nos da un par de ecuaciones para las derivadas parciales 
de h: 


D l ti(s, t ) = DJ(x,y) D^fs, t ) + DJ(x,y) Digfs, t), 

D 2 h(s, t) = DJ(x,y) Dtg^s, t ) + D 2 f(x,y ) D 2 g 2 (s, t ). 

Empleando el signo 8, tambidn se pone este par de ecuaciones en la forma 


, g27 , = + d A = $L?I , dfdy 

' ds dx ds dy ds ’ dt dx dt dy dt 

ejemplo 2. Coordenadas polares. La temperatura de una placa delgada 
se representa por un campo escalar f, siendo f(x, y) la temperatura en (x, y). 
Introduciendo las coordenadas polares x = r cos 0, y = r sen 6, la temperatura se 
convierte en una funcion de r y 9 determinada por medio de la ecuacion 

<p( r > 6) = fir cos 6, r sen 0). 

Expresar las derivadas parciales dy/dr y d<p/d6 en funcion de las derivadas par¬ 
ciales df/dx y df/dy. 


Solution. Utilicemos la regia de la cadena en la forma (8.27), poniendo 
(r, 0) en lugar de (s, t), y <p en lugar de h. Las ecuaciones 

x — r cos 0, y — r sen 0 

nos dan 


~ cos0 > ^ = sene ’ ~ = —r sen0, ^ = rcos0. 


dr 


Sustituyendo esas formulas en (8.27) obtenemos 

,o 9sn d( P , df a d<P 8/ df 

(8.28) —■ = — cos 0 + — sen0, -f- = -r — sen0 + r — cos 0. 

dr dx dy dd dx dy 

Estas son las formulas pedidas correspondientes a d(p/dr y d<p/dd. 


ejemplo 3. Derivadas parciales de segundo orden, Continuando el ejem¬ 
plo 2, expresar la derivada parcial de segundo orden d^y/dd* en funcion de las 
derivadas parciales de /. 


Solution. Comencemos con la formula que da dcp/dd en (8.28) y derivemos 
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respecto a 6, considerando r como una constante. En el segundo miembro hay 
dos terminos, cada uno de los cuales debe derivarse como producto. Obtenemos 
asi 


3V _ 3/ 3(sen0) _ rsen(9 _3/3A , r dfd(cosO) 

36 2 dx dO dd [dx/ dy dO 


+ rcosd A(V\ 

dO\dy) 


(8.29) 


D df „ 3 
— r cos 0 —— r send 


dx 


dO\dx] 


3 / 


r sen0 — + r cos 0 — (—\ . 
dy dO\dy) 


Para calcular las derivadas de 3 f/dx y df/dy respecto a 0 debe tenerse en 
cuenta que como funciones de r y 0, df/dx y df/dy son funciones compuestas 
dadas por 


— = DJ(r cos 0, r sen 6) 
dx 


y 


3/ 

— = D 2 /(r cos 6 , r senfl). 
dy 


Por consiguiente, sus derivadas respecto a 0 tienen que determinarse con la regia 
de la cadena. Apliquemos otra vez (8.27), reemplazando / por D,f, con lo que 
se obtiene 


3/3/\ d(DJ)dx d(DJ)dy d i f ( d*f . 

— I —I = —-— + —-— = — (-r sen0) + (r cos 0). 

dx dO dy dO dx 2 dy dx 


dO[dx/ 


Del mismo modo, aplicando (8.27) reemplazando f por D 2 f, encontramos 


30 W 


3(D 2 /) dx d(DJ) dy d 2 f 


+ 


dx dO dy dO dx dy 


dH 

(—rsen 0) + -^(rcos 0) 
dy 2 


Cuando estas formulas se aplican en (8.29) obtenemos 


d 2 cp 

dO 2 


— r cos 0 -A + r 2 sen 2 0 — r sen 0 cos 0 —— 

ox dx 2 dy dx 

— r sen 0 -A — r 2 sen 0 cos 0 —1- r' 1 cos 2 0 

3y 3x 3y dy 2 ' 


Esta es la formula que deseabamos para d 2 <p/dO i . Formulas analogas para las 
derivadas parciales segundas d^fdr\ d\f{dr 30), y 3V/(30 3r) se proponen 
en el ejercicio 5 de la proxima seccion. 
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8.22 Ejercicios 

En estos ejercicios puede suponerse la diferenciabilidad de todas las funciones que se 
consideran. 

1. La sustitucion t = g(x, y) convierte F(f) en j(x, y), siendo f(x, y) = F[g(x,y)J. 

a) Demostrar que 

i| y if. 

b) Considerese el caso particular F(t) = f , g(x, y) = cos (x 2 + y 2 ). Calcular df/dx 
y 9//3y utilizando las formulas del apartado a). Comprobar el resultado, determinando 
f(x,y) explicitamente en funcion de x e y, y calculando directamente df/dx y df/dy a 
partir de f. 

2. La sustitucion u — (x — y)/2, v = (x + y)/2 cambia f(u, v) en F(x, y). Aplicar en forma 
adecuada la regia de la cadena para expresar las derivadas parciales dF/dx y 
dF/dy en funcion de las derivadas parciales df/du y df/dv. 

3. Las ecuaciones u = f(x,y), x = X(s, t), y — Y(s,t) definen u como funcion de s y t, 
u = F(s, t). 

a) Aplicar una forma adecuada de la regia de la cadena para expresar las derivadas par¬ 
ciales dF/ds y dF/dt en funcion de df/dx, df/dy, dX/ds, dX/dt, dY/ds, dY/dt. 

b) Si d 2 f/(dx dy) = d 2 f/ ( dy dx), demostrar que 

d 2 F _ df d 2 x a 2 // dx\ 2 dx dY a 2 / a/ a 2 r a 2 //ar\ 2 

ds 2 dx ds 2 dx 2 \ ds / ds ds dx dy dy ds 2 dy 2 \ ds / 

c) Encontrar formulas parecidas para las derivadas parciales d 2 Fj(ds dt)y d 2 F/dt 2 . 

4. Resolver el ejercicio 3 en cada uno de los siguientes casos particulares: 

a) X(s, t) — s + t, F(i, t) — st. 

b) Z(s, t) = st, Y(s, t ) = s/t. 

c) X(s, t) = (s - 0/2 , Y(s, t) = (s + 0/2. 

5. La introduccion de las coordenadas polares cambia f(x, y) en tp(r, 6), donde x — r cos 9 
e y — r sen 9. Expresar las derivadas parciales de segundo orden d 2 cp/dr 2 , d 2 <p/(dr dd ) y 
d 2 <p/(dd dr) en funcion de las derivadas parciales de /. Pueden utilizarse las formulas 
deducidas en el ejemplo 2 de la seccion 8.21. 

6. Las ecuaciones u = /(x,y,z), x ■= X(r,s,t), y = Y(r,s,t) y z = Z(r,s,t), definen u 
como funcion de r, s y t, sea esta u = F(r, s, t). Aplicar la forma adecuada de la regia 
de la cadena para expresar las derivadas parciales dF/dr, dF/ds,ydF/dten funcion de las 
derivadas parciales de f, X, Y y Z. 

7. Resolver el ejercicio 6 en cada uno de los casos particulares siguientes: 

a) X(r,s, t) =r + s +/, Y(r, s, t) = r - 2s + 3t, Z(r, s, t) = 2r + s - t. 

b) X(r, s, t) =r 2 + s 2 + t 2 , Y(r, s,t) = r 2 - s 2 - t 2 , Z(r, s, t) = r 2 - s 2 + t 2 . 

8. Las ecuaciones u = f(x, y, z), x = X(s, t), y = Y(s, t), z = Z(s, t) define u como funcion 
de s y /, sea esta u = F(s, t). Aplicando una forma adecuada de la regia de la cadena 
expresar las derivadas parciales dF/ds y dF/dt en funcion de las derivadas parciales de 
f,X,YyZ. 
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9. Resolver el ejercicio 8 en cada uno de los casos particulares siguientes: 

a) X(s, t) = s 2 + t 2 , Y(s, t) = s 2 — t 2 , Z(s,t)=2st. 

b) X(.s, t) = s + /, Y(s,t)=s—t, Z(s,t)—st. 

10. Las ecuaciones u = fix,y), x = X(r,s,t), y = Y(r, s, t) definen u como funcidn de r, s y 
t, sea esta u = F(r,s,t). Aplicar una forma adecuada de la regia de la cadena y expre- 
sar las derivadas parciales dF/dr, 3FJ ds y dFj dt en funcion de las derivadas parciales de 
/, X e y. 

11. Resolver el ejercicio 10 en cada uno de los casos particulares siguientes: 

a) X(r, s, t) = r + s, Y(r,s,t)=t. 

b) X(r, s, t) = r + s + /, Y(r, s, t) = r 2 + i 2 4- t 2 . 

c) X(r, s, t) = r/s , Y(r, s, t) = s/t. 

12. Sea h(x) =f[g(x)], donde g = (gi ,... ,g„) es un campo vectorial diferenciable en a, 
y / un campo escalar diferenciable en b — g(a). Utilizar la regia de la cadena para de- 
mostrar que el gradiente de h puede expresarse como combinacion lineal de los vectores 
gradientes de los componentes de g, asi: 

VA(«) = 1 D k f(b)V gk (a). 

fc=l 

13. a) Si f{x, y, z) = xi + yj + zk demostrar que la matriz jacobiana Df (x, y, z) es la 
matriz identidad de orden 3. 

b) Hallar todos los campos vectoriales diferenciables /: R 3 -*• R 3 para los que la ma¬ 
triz jacobiana Df (x, y, z) es la matriz identidad de orden 3. 

c) Hallar todos los campos vectoriales diferenciables /: R 3 '^'R 3 para los que la matriz 
jacobiana es una matriz diagonal de la forma diag ( p(x ), q{y), r(z)), en la que p, q y r 
son funciones continuas dadas. 

14. Sean /: R 2 -► R 2 y g: R 3 — R 2 dos campos vectoriales definidos del siguiente modo: 

f(x,y) - e x+2v i + sen (y + 2 x)j, 
g(u, v, w) — (« + 2v 2 + 3 w 3 )i + {2v - u 2 )]. 

a) Calcular cada una de las matrices jacobianas Df(x,y ) y Dg(u,v,w). 

b) Calcular la funcion compuesta h (u, v, w) =f[g(u, v, w)]. 

c) Calcular la matriz jacobiana Dhll, —1,1). 

15. Sean/: R 3 -»R 2 y g: R 3 -*■ R 3 dos campos vectoriales definidos como sigue: 

fix, y, z) = (x 2 + y + z) i + (2x + y + z 2 )j, 
giu, v, w) = uv 2 w 2 i + w 2 sen v j + u 2 e v k. 

a) Calcular cada una de las matrices jacobianas Dfix, y, z) y Dg(u, v, w). 

b) Calcular la funcion compuesta h iu, v, w) =f[g{u, v, w)]. 

c) Calcular la matriz jacobiana Dhiu, 0, tv). 


* 8.23 Condiciones suficientes para la igualdad de las derivadas parciales mixtas 

Si f es una funcion real de dos variables, las dos derivadas parciales mixtas 
Di 2 f y D 2 ,if no son necesariamente iguales. Con la notacion D U2 f queremos 
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significar DfDJ) = d 2 f/(dx By) y con D 2 l f signi'ficar DfDJ) = B 2 f\{By Bx). 
Por ejemplo, si / esta definida por las ecuaciones 


f(x, y) = xy X — para (x,y)^(0, 0), f(0,0) = 0, 

-x + y 

es sencillo dernostrar que D 2 ,ifi0,0) = — 1 y 0,0) = 1. Esto puede verse 
asi: 

La definition de D 2 . i/(0, 0) establece que 


(8.30) 

Ahora bien 


D 2>1 /(0, 0) = lim —‘-ft 0 ’ k) ~ Dl/(0 ’ 0) . 

fc-o k 


DJ{0, 0) = lirn^-^— IQ® = o 

fc-o h 

y, si (x,y) # (0, 0), encontramos 

(x 2 + y 2 ) 2 


Por consiguiente, si k # 0 tenemos DJI 0,k) = —k r ’/k i = — y por tanto 

DJjO, /c) - DJCQ, Q) ^ _ 
k ~ 

Aplicando este resultado en (8.30) encontramos que D 2 ,i/(0, 0) = — 1. Con ra- 
zonamiento parecido demostramos que Di 2 /(0,0) = 1, y por tanto D 21 f( 0,0)# 
^D^fiO, 0 ). 

En el ejemplo que acabamos de considerar las dos derivadas parciales mix- 
tas D li2 f y D 2A { son ambas no continuas en el origen. Puede demostrarse que 
las dos parciales mixtas son iguales en un punto (a, b) si por lo menos una de 
ellas es continua en el punto. Demostraremos primero que son iguales si ambas 
son continuas. Con mayor precision, tenemos el teorema siguiente. 


TEOREMA 8.12. CONDICION SUFICIENTE PARA LA IGUALDAD DE LAS DERIVA¬ 
DAS parciales mixtas. Si f es un campo escalar tal que las derivadas parciales 
Dif, D 2 f, D,,f y Dif existen en un conjunto abierto S. Si (a, b) es un 
punto de S, y en tal punto Di, 2 { y D 2 i f son continuas, entonces tenemos 

(8.31) D l t f(a, b) = D 21 f(a, b). 

Demostracion. Elijamos h y k no nulos tales que el rectangulo R(h, k) 
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con vertices (a, b), (a + h, b), (a + h, b + k) y (a, b + k) este situado en S. 
(Vease figura 8.9.) 


(a, b + k) 


(a + h, b + k) 


— 

--< 

+ 

+ 

— 


(a, b) (a + h, b) 


Figura 8.9 V(h,k) es una combinacidn de los valores de f en los vertices. 
Consideremos la expresion 

A(h, k ) — f(a + h, b + k) - f(a + h, b) - f(a, b + k) + f(a, b ). 

Es esta una combinacidn de los valores de / en los vertices de R(h, k), tornados 
con los signos algebraicos indicados en la figura 8.9. Expresaremos A (h,k) en 
funcion de D. 2A f y tambien de D ii2 f. 

Consideremos una nueva funcion G de una variable definida por la ecuacion 
G(x) =f(x, b + k) - f(x, b) 

para todo x comprendido entre a y a + h. (Geometricamente, consideramos los 
valores de / en aquellos puntos en los que una recta vertical corta los lados hori- 
zontales de R(h, k.) Tenemos entonces 

(8.32) A (h, k) = G(a + h) - G(a) . 

Aplicando el teorema del valor medio uni-dimensional al segundo miembro de 
(8.3) obtenemos G(a + h) — G(a) = hG'(x 1 ), siendo Xi un punto situado entre 
a y a + h. Puesto que G\x) — DJix, b + k) — Dif(x, b), la ecuacion (8.32) 
se transforma en 

(8.33) A (h, k) = h [£,/(*!, b + k) — Dtflxu *)]. 


Aplicando el teorema del valor medio al segundo miembro de (8.33) obtenemos 
(8.34) A (h,k) = hkD itl f(x 1 ,y 1 ), 
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siendo j^un punto situado entre 6 y ft + k. El punto (.Xa, y t ) pertenece al rec- 
tangulo R(h, k). 

Aplicando el mismo procedimiento a la funcidn H(y) = f(a + h,y) — f(a, y) 
encontramos una segunda expresion para A(ft, k), o sea, 

( 8 - 35 ) A(ft, k) = hkD 12 f(x 2 , yd , 

donde (x 2 , y 2 ) pertenece tambien a R(h, k). Igualando las dos expresiones de 
A(ft, k) y suprimiendo hk obtenemos 


D i.if(x u yd - D 2 J(x 2 ,yJ. 

Hagamos ahora que (h, k ) -> (0, 0) y teniendo en cuenta la continuidad de D lx f 
y D 2ll f en el punto (a, ft) obtenemos (8.31). 

El razonamiento anterior puede modificarse para demostrar una version mas 
fuerte del teorema 8.12. 

teorema 8.13. Si f es un campo escalar para el cual existen las derivadas 
parciales Dij, D 2 f y D 2 ,i/ en un conjunto abierto S que contenga (a, ft), y si ademas 
£> 2 , 1 / es continua en S, entonces existe la derivada Dirf(a, ft) y tenemos 


D U2 f{a, ft) = D 21 f(a, ft). 


Demostracion. Definamos A (ft, k) como en la demostracion del teorema 
8.12. La parte de la demostracion que lleva a la ecuacion (8.34) es valida, dan- 
donos 


( 8 - 36 ) ~~ = D 2,if( Xl , yd 

para un cierto (XTj.y!) del rectangulo R(h, k). El resto de la demostracion no es 
aplicable ya que precisa de la existencia de la derivada D ia f(a, ft), que es justa- 
mente lo que deseamos demostrar. 

La definicion de D li2 f(a, ft) establece que 


ft) = lim 


DJ(a + ft, ft) - DJ(a, ft) 


(8.37) 


h 
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Vamos a demostrar que este limite existe y que tiene el valor D 2ll f(a, b). A par- 
tir de la defin i cion de D 2 f tenemos 


y 


DJ{a, b) = lim 


/(q, b + k) — f(a, b) 
k 


D 2 /(q + h,b) — lim 
*-►0 


/(q + h, b + k) — /(q + h, b) 
k 


Por tahto el cociente de diferencias (8.37) puede escribirse del siguiente modo 


DJ(a + h,b)~ DJ(a, b ) = ^ A(/i, k) 
h *-o hk 

Teniendo en cuenta (8.36) podemos ponerlo en la forma 


(8.38) 


DJ(a + h,b)~ DJ(a, b) 
h 


= lim D %1 f(x lt yJ. 

k-> 0 


Para completar la demostracion tenemos que probar que 


(8.39) 


lim limD 2 ,i/(x 1 ,y 1 ) 

h->0 \_k-*0 


D i.xf(fi, b). 


Cuando k 0, el punto yi b, pero es desconocido el comportamiento de xi 
como funcion de k. Si suponemos que X\ se aproxima a algun limite, sea x, 
cuando fc -> 0, entonces por la continuidad de Di,if deducimos que 


lim D 2 'J( Xl , y x ) = D 2< J(x, b ). 

k-a 


Puesto que el limite x estaria en el intervalo a ^ x ^ a+h, podemos suponer que 
h -* 0 y deducir (8.39). No obstante, por el hecho de que x depende de k de for¬ 
ma desconocida, se hace necesario un argumento algo mas solido. 

En virtud de la ecuacion (8.38) sabemos que existe el siguiente limite: 


lim D 2il f ( Xl , y x ). 
0 
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Designemos este li'mite con F(h). Para completar la demostracion hay que pro¬ 
bar que 


lim F(h) = D 2 J{a,b). 

h-> 0 


A tal fin apelamos a la definicion de continuidad de D 2 ,if en (a, b ). 

Sea e un numero positivo dado. La continuidad de D 2 ,if en (a, b ) significa 
que existe un disco abierto N con centro en ( a, b) y radio 8, por ejemplo, tal 
que 


(8.40) I D 2.i/0> y) ~ D 2 ,J(a, b) | < ^ siempre que (x, y) e N ■ 

Si elegimos h y k de manera que \h\ < 8/2 y \k\ < 8/2, todo el rectangulo 
dibujado en la figura 8.9 estara contenido en el entorno N y, en particular, el 
punto (x lt yj) estara en N. Por consiguiente (8.40) es valida cuando (x, y) = 
= (*i> y 5 ) y podemos escribir 

(8.41) 0 ^ \D 2 J( Xl , yi ) - D 21 f(a, b )| < - . 

2 

Mantengamos ahora fijo h y hagamos que k~*Q. El termino D 2>1 /(x a , y,) tiende 
a F(h) y los otros terminos de (8.41) son independientes de k. Tenemos por tanto 

0<L\F(h)-D 2 'J(a, b)\<,~< e , 

con tal que 0 < \h\ < 8/2. Pero este es precisamente el significado de la pro- 
posicion 


lim F(h) = D 21 f(a, b) 

h->0 

y, como ya dijimos, esto completa la demostracion. 


Nota: Debera observarse que el teorema es tambien valido si en el enunciado intercam- 
biamos D ta f y 

8.24 Ejercicios varios 

1. Hallar un campo escalar / que satisfaga las dos condiciones siguientes- 
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a) Existen y son nulas las derivadas parciales D { j(Q, 0) y A/(0,0). 

b) Existe la derivada direccional en el origen en la direction del vector i +j y tiene 
el valor 3. Explicar por que tal funcion / no puede ser diferenciable en (0,0). 

2. Sea / una funcion defmida como sigue: 

2 2 

f(x,y) =y^r~i Si c X,y ) ^ (0, 0), /(0,0) = 0. 


Calcular, cuando existan, las derivadas parciales siguientes: 

Au/(°> 0), 0,0). 

xj 3 


£»i/(0, 0), £> 2 /(0, 0), 


3. Sea f(x, y) =■ 


x 3 +/ 


si (x, y) 5 (0,0), y definamos /( 0 , 0 ) = 0 . 


a) Demostrar que la derivada/'(O;«) existe para todo vector a y calcular su valor 
en funcion de los componentes de a. 

b) Determinar si / es o no continua en el origen. 

4. Definamos /(x, y) — J 'Vxv e -t* dt para x > 0, y > 0. Calcular df/dx en funcion de x e y. 

5. Supongamos que las ecuaciones u = fix, y), x = X((), y = Y(t) definen u como funcion 
de t, u = F(t). Calcular la derivada tercera F'"(t) en funcion de las derivadas de 
f,X,cY. 

6. El cambio de variables x = u + v, y — uv 1 transforma fix, y) en g (u, v). Calcular el 
valor de d 2 g/(dv Su) en el punto en el que u = 1, v = 1, sabiendo que 


sf a 2 / a 2 / a 2 / 

Sy Sx 2 Sy 2 8x Sy 



= 1 


en dicho punto. 

7. El cambio de variables x = uv, y —\(u 2 — v 2 ) transforma fix, y) en g(u, v). 

a) Calcular SgfSu, Sgjdv y S 2 gf(du 3t>)en funcion de las derivadas parciales de /. (Pue¬ 
de suponerse la igualdad de las parciales mixtas.) 

b) Si || V/(x,y )|| 2 = 2 para todo *ey, determinar las constantes a y b tales que 



8 . Dos funciones F y G de una variable y una funcidn z de dos variables estfin ligadas 
por la ecuacion 


[F(jc) + G(y)f = 2 F'(x)G'(y) 

con tal que F(x) + G(y) ^ 0. Demostrar que la derivada parcial mixta Di. iz(x, y) nunca 
es cero. (Puede suponerse la existencia y continuidad de todas las derivadas que 
aparezcan.) 

9. Un campo escalar f es acotado y continuo en un rectangulo R = [a, b] X [c, d). Se de¬ 
fine en R un nuevo campo escalar g del modo siguiente: 


g{u, v) = jj "f(x,y)dxj dy. 
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a) Puede demostrarse que para cada u fija en [a, b] la funcion A definida en [c, d] 
mediante la ecuacion A(y) = j“/(x, y) dx es continua en [c, d], Utilizar este resultado 
para demostrar que dg/dv existe y es continua en el rectangulo abierto S = (a, b) X ( c, d) 
(el interior de R). 

b) Supongase que 


(J y) dx ] d y = J;[J>.7 )*] dx 


para todo ( u , v) de R. Demostrar que g es diferenciable en S y que las derivadas parcia- 
les mixtas £>,. 2 g(u, v) y Di,ig(u, v) existen y son iguales a f(u, v) en cada punto de S. 

10. En relacion con el ejercicio 9. Supongase que u y v se expresan parametricamente del 
siguiente modo: u = A ( t ), v = B(t); y sea <p(t) = g{A{t),B(t)~[. 

a) Determinar <p'(t) en funcion de f, A! y B'. 

b) Calcular <p'(t) en funcion de t cuando f(x, y) = e xhv y A(t) = B(t) = t 2 . (Supongase 
que R esta situado en el primer cuadrante.) 

11. Si f(x, y, z) =(r x A) ■ (r x B), siendo r = xi + yj + zk y A y B son vectores cons- 

tantes, demostrar que V/(x, y, z) = B x (r x A) + A x (r x B). 

12. Sear = xi + yj + zk y pongamos r = ||r|| . Si ^ y B son vectores constantes, demos¬ 

trar que: | 


a ) A - V 


A r 


b) B ■ V 



3 A rB r 


A B 


13. Hallar el conjunto de todos los puntos ( a,b,c ), en el espacio de 3 dimensiones, en los 
cuales las dos esferas (x — a) 2 + (y — bf + (z — c) ! = 1 y x 2 + y 2 + z 2 — 1 se cortan 
ortogonalmente. (Sus pianos tangentes deber&n ser perpendiculares en cada punto de 
interseccidn.) 

14. Un cilindro cuya ecuacidn es y = f(x) es tangente a la superficie z 1 + 2 xz + y = 0 en 
todos los puntos comunes a las dos superficies. Hallar j(x). 
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APLICACIONES DE CALCULO DIFERENCIAL 


9.1 Ecuaciones diferenciales en derivadas parciales 

Los teoremas de Calculo diferencial desarrollados en el capftulo 8 tienen 
gran numero de aplicaciones. Este capftulo muestra su utilizacion en algunos 
ejemplos relativos a las ecuaciones diferenciales en derivadas parciales, a las 
funciones implfcitas y a problemas de extremos. Comenzamos con algunas obser- 
vaciones elementales referentes a las ecuaciones diferenciales en derivadas par¬ 
ciales. 

Una ecuacion que relaciona un campo escalar / y sus derivadas parciales se 
llama ecuacion diferencial en derivadas parciales. Dos ejemplos sencillos en los 
que / es una funcion de dos variables son la ecuacion de primer orden 

(9.1) y) = o 

dx 

y la de segundo orden 

(9.2) d 2 /Q> y) , d 2 /(*. y) = Q 

dx 2 dy 2 

Cada una de ellas es una ecuacion diferencial en derivadas parciales lineal ho- 
mogenea. Esto es, cada una tiene la forma L(f) = 0, siendo L un operador dife¬ 
rencial lineal que contiene una o mas derivadas parciales. La ecuacion (9.2) se 
llama ecuacion de Laplace bi-dimensional. 

Parte de la teorfa de las ecuaciones diferenciales lineales ordinarias puede 
extenderse a las ecuaciones diferenciales en derivadas parciales. Por ejemplo, es 
facil comprobar que para cada una de las ecuaciones (9.1) y (9.2) el conjunto 
de soluciones es un espacio lineal. Sin embargo, hay una diferencia importante 
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entre las ecuaciones diferenciales lineales en derivadas parciales y las lineales 
ordinarias, que debe ser mencionada desde el principio. Ponemos de manifiesto 
esa diferencia comparando la eeuacion en derivadas parciales (9.1) con la ecua- 
cion diferencial ordinaria 

(9-3) /'(*) = 0. 

La funcion mas general que satisface (9.3) es f(x) = C, siendo C una cons- 
tante arbitraria, Es decir, el espacio-solucion de (9.3) es uni-dimensional. Pero 
la funcion de tipo mas general que satisface (9.1) es 

fix, y) = giy ), 

donde g es una funcion cualquiera de y. Puesto que g es arbitraria podemos 
obtener con facilidad un conjunto infinito de soluciones independientes. Por ejem- 
plo, podemos tomar g(y) = e' v y hacer que c varfe en todo el campo real. Asf 
pues, el espacio solucion de (9.1) es de infinitas dimensiones. 

En ciertos aspectos este ejemplo refleja lo que en general ocurre. Algunas 
veces en la resolucion de una eeuacion en derivadas parciales de primer orden, 
se precisa una integration para hacer desaparecer cada derivada parcial. Entonces 
se introduce un funcion arbitraria en la solucion. Esto ocurre en un espacio de 
soluciones de infinitas dimensiones. 

En muchos problemas que incluyen ecuaciones en derivadas parciales es 
preciso seleccionar del conjunto de soluciones una solucion particular que satis- 
faga una o mas condiciones auxiliares. Como es logico la naturaleza de esas 
condiciones tiene un efecto profundo en la existencia o en la unicidad de las 
soluciones. En este libro no se llegara a un estudio sistematico de tales proble¬ 
mas. En cambio, trataremos algunos casos particulares para ilustrar las ideas 
introducidas en el capitulo 8. 

9.2 Eeuacion en derivadas parciales de primer orden con coeficientes constantes 

Consideremos la eeuacion en derivadas parciales de primer orden 

(9.4) 3 9/(x,y) | 2 df(x,y) _ 0 

dx dv 

Todas las soluciones de esta eeuacion pueden encontrarse mediante considera- 
ciones geometricas. Expresemos el primer miembro como un producto escalar, 
y pongamos la eeuacion en la forma 


(3* + 2 j) • V/(x,_y) = 0. 
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Esto nos dice que el vector gradiente V fix, y) es ortogonal al vector 3/4- 2 j en 
cada punto (x, y). Pero sabemos tambien que V/(x, y) es ortogonal a las curvas 
de nivel de /. Luego esas curvas de nivel deben ser rectas paralelas a 3 i + 2j . 
Es decir, las curvas de nivel de / son las rectas 

2x — 3y = c. 

Por lo tanto fix, y) es constante cuando 2x — 3y es constante. Esto sugiere que 

(9.5) f(x,y) =g(2x - 3y) 
para alguna funcion g. 

Comprobemos ahora que, para cada funcion diferenciable g, el campo esca- 
lar / definido por (9.5) satisface realmente (9.4). Utilizando la regia de la cadena 
para calcular las derivadas parciales de / encontramos 

|=- 3 s '(2,-3,). 

3 3x + 2 dy = 6g ( - 2x — ^ ~ 6 8 ( 2x ~ 3y) = 0. 

Por consiguiente, / satisface (9.4). 

Recfprocamente, podemos demostrar que toda funcion / diferenciable que 
satisfaga (9.4) necesariamente debe ser de la forma (9.5) para una cierta g. 
Para ello, introduzcamos un cambio lineal de variables, 

(9.6) x = Au + Bv, y = Cu + Dv. 


Este transforma fix, y) en una funcion de u y v, sea esta 
hiu, v) — ffAu + Bv, Cu -f Dv). 

Elegiremos las constantes A, B, C, D de modo que h satisfaga la ecuacidn mas 
sencilla 

(9.7) dhju,v) _ Q 

du 

La resolveremos y demostraremos que / tiene la forma deseada. 

Con la regia de la cadena encontramos 

— = + A+ d JL c ' 

du dx du dy du dx dy 
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Puesto que / satisface (9.4) tenemos df/dy = —(3/2)(3 f/dx), por lo que la ecua- 
cion toma la forma 


dh 

du 



Por consiguiente, h satisfara (9.7) si elegimos A = fC. Tomando A = 3 y C = 2 
encontramos 


( 9 -8) x = 3 u + Bv, V = 2 u+Dv. 

Con esta election de A y C, la funcion h satisface (9.7), asf que Hu, v) es una 
funcion solo de v, 


Hu, v) = g(v) 

para una cierta funcion g. Para expresar v en funcion de r e y eliminamos u en 
(9.8) y obtenemos 2x — 3y = (26 — 3 D)v. Elijamos ahora B y D de manera que 
26 — 3 D = 1, por ejemplo 6 = 2, D — 1. Para estos valores la transformacion 
(9.6) es no singular; tenemos v = 2x — 3y, y por tanto 


Ax, v) = h(u, v) = g(v) = g( 2x - 3 y). 


Esto demuestra que toda funcion diferenciable / solucion de (9.4) tiene la for¬ 
ma (9.5). 

El mismo tipo de razonamiento demuestra el siguiente teorema para las 
ecuaciones de primer orden con coeficientes constantes. 

teorema 9.1. Si g es una funcion diferenciable en R 1 y f es el campo 
escalar definido en R 2 por medio de la ecuacion 

(9-9) f{x, v) = g{bx - ay), 

en la que a y b son constantes, no simultaneamente nulas, entonces f satisface 
la ecuacion en derivadas par dales de primer orden 

(9.10) a d l(l:.y\ b d f( x ’ y) = Q 

dx dy 

en todo R 2 . Reciprocamente, toda solucion diferenciable de (9.10) tiene necesaria- 
mente la forma (9.9) para una cierta g. 
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9.3 Ejercicios 

En este conjunto de ejercicios puede suponerse la diferenciabilidad de todas las fun- 
ciones que se consideran. 

1. Determinar la solucion de la ecuacion en derivadas parciales 

4 j& i > + 3 2^Z>_ 0 

ox dy 

que satisfaga la condicion f(x, 0) = sen x para todo x. 

2. Determinar la solucion de la ecuacidn en derivadas parciales 

5 m^y) 2 m*,y) Q 

dx dy 


que satisfaga las condiciones /(0,0) = 0, y D,f(x, 0) = e” para todo x. 

3. a) Si u(x, y) = f(x y), demostrar que u satisface la ecuacidn en derivadas parciales 


3 u 3 u 



Hallar una solucidn tal que u(x,x) = para todo x. 

b) Si v(x,y) — f(x/y) para y ^ 0, demostrar que v satisface la ecuaci6n en derivadas 
parciales 


Sv dv 

x T x + yj,-°- 

Hallar una solucidn tal que v(l, 1) = 2 y D t v(x, Mx) = 1/x para todo x^0. 

4. Si g(u, v) satisface la ecuacidn en derivadas parciales 

d *g(M, v) 

3 u 3v 

demostrar que g(u, v) = <p t (u) + <pi(v), donde <pi(u) es una funcidn s61o de u y <P 2 (p) 
lo es unicamente de v. 

5. Supdngase que f satisface la ecuacion en derivadas parciales 

3? / 2 d V *f . 

3jc 2 dx dy dy 2 

Introducir el cambio lineal de variables x = Au + Bv, y = Cu + Dv, siendo A, B, C, D 
constantes, y pongase g(u, v) = f(Au + Bv, Cu + Dv). Calcular valores enteros no nulos 
de A, B, C, D para los que g satisfaga 3 ! g/(9 udv) = 0. Resolver esta ecuacidn corres- 
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pondicnte a (j y dctcrminar luego /. (Supongase la igualdad de las derivadas parciales 
mixtas.) 

6 . Una funcion u esta definida mediante una ecuacion de la forma 


u(x,y) = xyf 



Demostrar que u satisface la ecuacion diferencial de la forma 


dlt 

x ~T x -y'T y = G{x ’y )u ' 

y hallar G(x, y). 

7. La sustitucion x = e\ y = e l transforma f(x,y) en g(s,/), siendo g(s, t) = f(e s , e*). Si se 
sabe que f satisface la ecuacion en derivadas parciales 


ay 

Bx 2 


2 52 / , .. 3 / 




d f 


demostrar que g satisface la ecuacion en derivadas parciales 


ds 2 a / 2 


8 . Sea / un campo escalar diferenciable en un conjunto abierto S de R\ Decimos que / es 
homogenea de grado p en S si 


f{!x) = t<f(x) 

para todo t > 0 y todo x de S para los que t x 6 S. Demostrar que para un campo es- - 
calar homogeneo de grado p se tiene 


x ■ c) = p f(x ) para cada x de S. 


Este es el llamado teorema de Eu.er para las funciones homogeneas. Si x = (xi,..., x„) 
puede expresarse del siguiente modo 

3 f ¥ 

Xl + " ' + ^ 17 n = P^ . Xn) • 


t Indicacion: Para x,fijo, deffnase g (t) = f(/x ) y calcular g'(l).] 

9. Demostrar el reciproco del teorema de Euler. Esto es, si / satisface x .V/(x) = pf(x) 
para todo x en un conjunto abierto S, f debe ser homogeneo de grado p en S. [ Irtdica- 
cion: Para x, fijo, deffnase g(/) = f(tx) - tff(x) y calcular g'(t).] 
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10 Demostrar la siguiente extensi6n del teorema de Euler para funciones homogeneas de 
grado p en el caso de dos dimensiones. (Sup6ngase la igualdad de las derivadas par- 
ciales mixtas.) 


ay 

dx 2 


+ 2 xy 


ay 

hTy + y‘%> ~P(P-'V- 




9.4 La ecuacion de ondas uni-dimensional 

Imaginemos una cuerda tensa de longitud infinita a lo largo del eje x y que 
puede vibrar en el piano xy. Designemos con y = fix, t) el desplazamiento ver¬ 
tical de la cuerda en el punto x en el instante t. Supongamos que, en el instante 
t = 0, la cuerda esta desplazada tomando la forma de una curva y = Fix). En la 
figura 9.1 a) se representa un ejemplo. Las figuras 9.1 b) y c) muestran las posi- 
bles curvas de desplazamiento para valores postenores de t. Consideremos el des¬ 
plazamiento fix, t ) como una funcion incognita deryi que hay que determinar. 
Un modelo matematico para este problema (sugerido por considerations fisicas 
que aqui no comentaremos) es la ecuacion en derivadas parciales 

dt 2 dx 2 ’ 

en la que c es una constante positiva que depende de las caracteristicas fisicas de 
la cuerda. Esta ecuacion es la llamada ecuacidn de ondas uni-dimensional. La re- 
solveremos teniendo en cuenta ciertas condiciones auxiliares. 



yk 




y-fix, i) 

/TV.. 


/V 


/V':: 


-1 0 1 
b)f = 1 


- 2-10 1 2 
c) / = 1 


Figura 9.1 Curva de desplazamiento y = fix, t) para varios valores de t. 

Puesto que el desplazamiento inicial es la curva dada y = Fix), vamos a 
buscar una solucion que satisfaga la condicion 


fix,0) = Fix). 
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Supondremos tambien que dy/dt, la velocidad de desplazamiento vertical, esta 
dada en el instante t = 0, a saber 

D z f(x, 0) = G(x), 

siendo G una funcidn dada. Parece razonable pensar que esta information debe- 
ria bastar para determinar el subsiguiente movimiento de la cuerda. Demostrare- 
mos que esto es cierto, efectivamente, determinando la funcion / por medio de 
F y G. La solucion se expresa en una forma dada por Jean d’Alembert (1717- 
1783), matematico y filosofo frances. 

TEOREMA 9.2. SOLUCldN DE D’ALEMBERT DE LA ECUACldN DE ONDAS. Dadas 
las funciones F y G tales que G es derivable y F dos veces derivable en R 1 . La 
funcion f dada por la formula 

(9.11) /(*, » = S* + «) + Hx - c.) J_ f •*“ 

2 2c. J x -ct 

satisface la ecuacidn de ondas uni-dimensional 

(9.12) d If =c *?l 

dt 2 dx 2 

y las condiciones iniciales 

(9.13) fix, 0) = F(x ), D 2 f{x, 0) = G(x) . 

Reciprocamente, cualquier funcidn f con derivadas parciales iguales que satisfaga 
(9.12) y (9.13) tiene necesariamente la forma (9.11). 

Demostracion. Comprobar que la funcion / dada por (9.11) satisface la 
ecuacion de ondas y las condiciones iniciales, es un ejercicio que dejamos al lector. 
Demostraremos el recfproco. 

Un modo de hacerlo consiste en suponer que / es una solucidn de la ecuacidn 
de ondas, introducir un cambio lineal de variables, 

x = Au + Bv, t = Cu + Dv, 
que transforma f(x, t ) en una funcidn de u y v, 


g(u, v ) =f(Au + Bv, Cu + Dv ), 
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y elegir las constantes A, B. C, D de modo que g satisfaga la ecuacion mas sen- 
cilla 



du dv 


Resolviendo esta ecuacion encontramos que g(u, v)=<p 1 i u )Ani v ), donde ni u ) es 
una funcion de u solamente y donde <p 2 i v ) sdlo lo es de v. Las constantes A, B, 
C, D pueden elegirse de manera que u=x+ct, v=x—ct, de donde obtenemos 


(9.14) fix, t) = (pfx + ct) + ni x - ct). 

Hecho esto utilizamos las condiciones iniciales (9.13) para determinar las fun- 
ciones <p x y <p t por medio de las funciones dadas F y G. 

Obtendremos (9.14) por medio de otro metodo que utiliza el teorema 9.1 
y evita el cambio de variables. Escribimos primero la ecuacidn de ondas en la 
forma 


(9.15) LiiL 2 f) = 0, 

siendo L x y U operadores diferenciales lineales de primer orden dados por 


Li = 


d__ d_ 
dt dx ’ 


L 2 = — + c — . 
dt dx 


Sea / una solucion de (9.15) y pongamos 


uix, t) = L 2 f(x, t). 


La ecuaci6n (9.15) establece que u satisface la ecuacidn de primer orden Lj(«)=0. 
Luego, segun el teorema 9.1 tenemos 

uix, t) = (pix + ct) 

para una cierta funcidn <p. Sea $ una funcion primitiva de <p, tal como $(y) = 
Jo <p(s)ds, y pongamos 


vix, t) — ~ + ct). 
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Demostraremos que L 2 (v) = L 2 (/). Tenemos 

asi que 

L 2 v — Yt + c = + c( ) = VC* + c 0 = «(*, 0 = L 2 f. 

Es decir, la diferencia f — v satisface la ecuacion de primer orden 

L 2 (f- v ) = 0. 

Segun el teorema 9.1 debe ser j(x, t) — v(x, t) = f(x — ct) para una cierta fun- 
cion <^. Por consiguiente 

f(x, t) = v(x, t) + yj(x — ct) = — <D(x + c 0 + yi(x — ct). 

2c 

Esto demuestra (9.14) poniendo (p r = — $ y <p 2 = *p. 

2c 

Utilicemos ahora las condiciones iniciales (9.13) para deierminar las funcio- 
nes <p x y <p 2 por medio de las funciones dadas F y G. La relacion /(x, 0) = F(x) 
implica 

(9.16) 9 >i(x) + <p 2 (x) = F(x). 

La otra condicion inicial, D 2 /(x, 0) = G(x), implica 

(9.17) c<p[(x) - c<p 2 (x) = G(x). 

Derivando (9.16) obtenemos 

(9.18) ?((*) + <pitx) = F'(x). 

Resolviendo (9.17) y (9.18) respecto a 95 '(x) y ^(x) encontramos 

7'i( x ) = ~ ^'(x) + ~ G(x), <p' 2 (x) = i F'(x) — — G(x). 

^ ic 2 2c 
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Integrando esas relaciones llegamos a 

yiW -„ ( o,.M2 + ij; c(s)ds , 

'„«) - -;,ioi - f(x) ~ f(0) - M'c(s) *. 

2 2c Jo 

Sustituyamos en la primera ecuacion x por x 4- ct y en la segunda x por x — ct. 
Luego sumemos las dos ecuaciones que resulten y teniendo en cuenta que q?i(0) + 
<p 2 (0) = F(0) obtenemos 


f(x, t) = 99j(x + ct) + cp 2 (x - ct) = 


F(x + c0 + F(x _ c( ) H- , 

2 2c J x -ct 


Esto completa la demostracion. 

ejemplo. Supongamos que el desplazamiento inicial viene dado por la 
formula 


F(x) = 


'1 + COS 7 TX 
l0 


para -l^x<l, 
P ara |x| > 1. 




b)t = 2 




4 


Figura 9.2 Solucidn de la ecuacidn de ondas representada para los valores t = 0 y t = 2. 


La grafica de F se muestra en las figuras 9.1 a) y 9.2 a). Supongamos que la 
velocidad inicial G(x) = 0 para todo x. Entonces la solucion que resulta de la 
ecuacidn de ondas viene dada por la formula 


f(x, 0 = 


F(x + ct) + F(x — ct) 


2 



356 


Aplicaciones de calculo diferencial 


Las figuras 9.1 y 9.2 representan la curva y = j(x, t) para varios valores de t. 
Las figuras ponen de manifiesto que la solucion de la ecuacion de ondas es una 
combinacion de dos ondas estacionarias, una que se desplaza hacia la derecha y 
la otra a la izquierda, cada una con velocidad c. 

En los ejercicios que siguen se dan ejemplos en los que se utiliza la regia de 
la cadena en el estudio de las ecuaciones en derivadas parciales. 

9.5 Ejercicios 


Podemos suponer en estos ejercicios la diferenciabilidad de todas las funciones que se 
consideran. 

L Si k es una constante positiva y g(x, t) = Ixjsj'kt, ponemos 


a) Demostrar que 


fix, t) = l^e-^du. 

Jo 


*L = e -.J°-!!K 

dx dx 


b) Demostrar que / satisface la ecuacion en derivadas parciales 

d-f df 

k ~ ~ft ( ecuaci dn del color). 

2. Consideremos un campo escalar / defmido en R J tal que j(x, y) dependa solo de la dis- 
tancia r del punto (x, y) al origen, j(x, y) = g(r), siendo r = (x 2 + y 2 )^. 

a) Demostrar que para (x, y) ^ (0, 0) tenemos 

a 2 / d-f l 

^+^=-S\r) +g " { r). 

b) Supongamos ademas que / satisface la ecuacion de Laplace, 

dx 2 a/ “ u ’ 

para todo (x,y) X- (0,0). Demostrar, aplicando la parte a) que /(x, y)=a log (x 2 + v 2 ) + b 
para (x, y) # (0,0), siendo ay b constantes. 

3. Repetir el ejercicio 2 en el caso n-dimensional, siendo « > 3. Esto es, supongase que 
f( x ) — A* 1 »• • •»*») — g(r)> siendo r = ||x||. Demostrar que 


a 2 / a 2 / n- 1 

dx* + ' " + 3? = W +g\r) 
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para x ^ O. Si / satisface la ecuacion de Laplace n-dimensional, 

3 2 f a 2 / 

^! + "' + ^r 0, 

para todox * 0, deducir que/(x)= a ||xf- n + 6 para x # O, siendo syf) constantes. 
Observacion: El operador lineal V 2 definido por la ecuacion 

S°-f 3 2 f 


se llama laplaciana n-dimensional. 

4. Laplaciana bi-dimensional en coordenadas polares. La introduccion de coordenadas po- 
lares x—r cos 9, y = rsentf, transforma /(x,y) en g(r, 6). Comprobar las siguientes for¬ 
mulas: 

a) || V/(r cos 0, r sen 0)|| 2 = + ^(^|) • 

ax 2 + a/ ar 2 r 2 ao 2 r 3r ' 

5. Laplaciana tridimensional en coordenadas esfericas. La introduccion de coordenadas 
esfericas 


x — p cos 0 sen <p, _y = p sen 0 sen <p , z = p cos y, 


transforma fix, y, z) en F(p, ®, <p). Este ejercicio indica como hay que proceder para 
expresar ia laplaciana V 2 / en funcion de las derivadas parciales de F. 
a) Introducir primero las coordenadas polares x -- r cos $, y = r sen 6 para transformar 
f(x, y, z) en g(r, e, z). Utilizar el ejercicio 4 para demostrar que 


V 2 / = 


If!? ,^g 

dr 2 r 2 36 2 r 3r 3z 2 ' 


b) Transformar luego g(r, »,z) en F(p,e,q>) tomando z = pcos<p, r = psenq>. Obser- 
vese que, salvo un cambio de notation, esta transformacion es la misma que la utilizada 
en la parte a). Deducir 


vy = 


3 2 F 2 3F 1 3 2 F 

3p 2 + p 3p + p 2 3q) 2 


cos <p 3F 1 3 2 F 

_ l -^__— . 

p 2 sen<p 09 > p 2 sen <p 3d 2 


6. Este ejercicio pone de manifiesto que la ecuacion de Legendre aparece cuando busca- 
mos soluciones de la ecuacion de Laplace que tengan una forma especial. Sea / un 
campo escalar que satisfaga la ecuacion de Laplace tri-dimensional, V 2 / = 0. Introduzca- 
mos coordenadas esfericas como en el ejercicio 5 y pongamos F(p, e, <p) = f(x, y, z). 
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a) Supongamos que buscamos soluciones / de la ecuacidn de Laplace tales que F(p, 8, <p) 
sean independientes de 8 y tengan la forma particular F(p, 8, <p) = p n G(<p). Demostrar 
que f satisface la ecuacion de Laplace si G satisface la ecuacidn de segundo orden 

d 2 G dG 

_ + c ° t + i )c=0- 


b) El cambio de variable x = cos <p (<p = arc cos x, -1 < x < 1) transforma G(<p) en 
g(x). Demostrar que g satisface la ecuacion de Legendre 


(1 ~ x * )d A ~ 2x % + < n + % - 0. 


7. Ecuacidn bi-dimensional de ondas. Una membrana delgada y flexible esta extendida 
sobre el piano xy y puede vibrar. Designemos con z = f(x, y, t) el desplazamiento vertical 
de la membrana en el punto (x, y) en el instante t. Ciertas consideraciones ffsicas su- 
gieren que / satisface la ecuacion bi-dimensional de ondas 

Si 1 >}>)’ 

en la que c es una constante positiva que depende de las caracten'sticas ffsicas de la 
membrana. Este ejercicio revela una conexion entre esta ecuacidn y la ecuacidn diferen¬ 
cial de Bessel. 

a) Introducir coordenadas polares x = r cos 8, y = r sen 8, y pongamos F(r, 8, t) = 
— /(r cos 8 t r sen 8, t). Si / satisface la ecuacidn de ondas demostrar que F satisface la 
ecuacidn 


— = 2 1 dF \ 

dt 2 ~ C \ dr 2 + r 2 !I 2 + ~rTrj- 

b) Si F(r, 0, t) es independiente de 0, F(r, 0, t) = tp(r, t ) la ecuacion a) se reduce a 

d 2< p / d 2 (p 1 d(p\ 

dt 2 ~ c \1? + ~ r Tr) ■ 

Sea ahora <p una solucion tal que y(r, t) se escinde en el producto de una funcidn de r 
por una funcidn de t, <p(r, t) = R(r)T(t). Demostrar que cada una de las funciones R y T 
satisface una ecuacidn diferencial lineal de segundo orden. 

c) Si la funcidn T del apartado b) es periddica de perfodo 2-n/c, demostrar que R sa¬ 
tisface la ecuacidn de Bessel r 2 R" + rR' + r 2 R = 0. 
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9.6 Derivation de funciones definidas impHcitamente 

Algunas superficies en el espacio de tres dimensiones se representan por ecua- 
ciones cartesianas de la forma 


F{x,y,z) = 0. 

Una ecuacion como esta, decimos, proporciona una representacidn implicita de la 
superficie. Por ejemplo, la ecuacion x 2 + y 2 + z 2 — 1 = 0 representa la superfi- 
cie de una esfera unidad con centro en el origen. Algunas veces es posible des- 
pejar en la ecuacion F(x, y, z) = 0 una de las variables en funcion de las otras 
dos, por ejemplo z en funcion de x e y. Esto nos conduce a una o varias ecuacio- 
nes de la forma 


z = f(x,y). 

Para la esfera tenemos dos soluciones, 

z = V1 — x 2 — y 2 y z = — V 1 — x 2 — y 2 , 

una representa la semiesfera superior, la otra la semiesfera inferior. 

En general no resulta sencillo obtener una formula explicita para z en fun¬ 
cion de x e y. Por ejemplo, no hay un metodo para despejar con facilidad z en 
la ecuacion y 2 + xz + z 2 — e z — 4 = 0. Sin embargo, utilizando en forma ade- 
cuada la regia de la cadena se pueden deducir varias propiedades de las derivadas 
parciales 9//8x y 9//9 y sin un conocimiento explicito de f(x, y). En esta section 
se expone dicho metodo. 

Supongamos que existe una funcion f(x, y) tal que 
(9.19) F[x,y,f(x,y)]- 0 

para todo (x, y) en un cierto conjunto abierto S, y que no sea posible dispo- 
ner de formulas explicitas para calcular fix, y). Expresemos esta diciendo que 
F(x, y, z) = 0 define z impUcitamente como funcion de x e y, y escribamos 

z —f{x,y). 

Introduzcamos ahora una funcion auxiliar g definida en S como sigue: 


g(x, y) = F[x,y,f(x,y)\. 
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La ecuacidn (9.19) establece que g(x, y) = 0 en S; luego las derivadas parciales 
dg/dx y dg/dy son tambien 0 en S. Pero tambien podemos calcular esas deriva¬ 
das parciales mediante la regia de la cadena. Para ello escribamos 

g(x,y) = F[u x (x,y), u 2 (x,y), u 3 (x,y)], 

siendo u l( x, y) = x, u 2 (x, y) = y, y u 3 (x, y) = f(x, y). La regia de la cadena nos 
da las formulas 


^ ^ + D,F ^ + D,F ^ ^ , D,f + D;F + D , F 851, 

ox ox ox ox dy dy dy By 


en las que cada derivada parcial D*F esta calculada en (x, y, j(x, y)). Puesto que 
tenemos 


du i _ j Su z _ Q du 3 ^ df 
dx ’ dx ’ dx dx ’ 


y 



la primera de las ecuaciones anteriores se transforma en 


D,F+ D 3 F^ = 0. 


dx 


Resolviendola respecto a df/dx obtenemos 


d J_ = _ D \F[x, y,f(x, y)] 
dx D 3 F[x, y,f(x, y)] 


en los puntos en los que D 3 F[x, y, f(x, y)] # 0. Mediante un razonamiento pare- 
cido obtenemos una formula analoga para 3//3y: 


Of. = _ D 2 F[x, y,f(x, y)] 
dy D 3 F[x, y,f(x, y)] 


en los puntos en los que D 3 F[x, y, f(x, y)] ¥= 0. Ordinariamente esas formulas 
se escriben mas brevemente asf: 
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ejemplo. Supongamos que la ecuaci6n y 2 -f xz + z 2 — e? — c = 0 defi¬ 
ne z como funcion de x e y, sea esta z = f(x, y). Hallar un valor de la constante 
c para el cual /(0, e) = 2, y calcular las derivadas parciales 3//3x y 3//3y en el 
punto (x, y) = (0, e). 

Solucidn. Cuando x = 0, y = eyz = 2la ecuacidn toma la forma e 2 + 4 
— e 2 — c = 0, y esta se satisface para c = 4. Sea F(x, y, z) = y 2 + xz + z 2 — 
e* — 4. De (9.20) y (9.21) obtenemos 

df _ _ 2 dj_ _ _ 2y 

dx x + 2z — e z ’ 3y x + 2z — e z 

Cuando x = 0, y - e, yz = 2 encontramos 3//3x = 2/(e 2 — 4) y 3//3y = 
2e/(e 2 — 4). Observese que hemos podido calcular las derivadas parciales df/dx 
y 3//3y utilizando tan solo el valor de f(x, y) en el punto (0, e). 

La discusion anterior puede extenderse a funciones de mas de dos variables. 

teorema 9.3. Si F es un campo escalar diferenciable en un conjunto abier- 
to T de R" y si suponemos que la ecuacidn 

F(x x ,,x n ) = 0 

define impUcitamente x n como funcion diferenciable de x x ,..., x n -i 


para todos los puntos (*i ,... en un cierto conjunto S de R” -1 , entonces 
para cada k = 1,2 ,,n — l, la derivada parcial Dkf viene dada por la formula 

(9.22) D k f = — ~~ 

n t 

en los puntos en los que D n F # 0. Las derivadas parciales DkF y D„F que apa- 
recen en (9.22) estan calculadas en el punto (x u x 2 ,... ,x n -\, f(Xi ,... ,x„-t)). 

La demostracion es una extension directa del razonamiento utilizado para 
deducir las ecuaciones (9.20) y (9.21) y la dejamos para el lector. 

La discusion puede generalizarse en otro sentido. Supongamos dos superfi¬ 
cies con las representaciones implicitas siguientes: 

(9.23) F(x, y, z) = 0, G(x, y, z) = 0. 

Si esas superficies se cortan a lo largo de una curva C, es posible obtener una 
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representation parametrica de C resolviendo las dos ecuaciones (9.23) simulta- 
neamente respecto a dos de las variables en funcion de la tercera, por ejemplo 
reyen funcion de z. Supongamos que sea posible despejar x e y y que las solu- 
ciones vengan dadas por las ecuaciones 

x = X(z), y=Y(z ) 

para todo z en un cierto intervalo abierto (a, b) Entonces cuando x e y se reem- 
plazan por X(z) e Y(z), respectivamente, las dos ecuaciones (9.23) se satisfacen 
identicamente. Esto es, podemos escribir F[X(z), Y(z), z] = 0 y G[X(z), Y(z), z] 
= 0 para todo z de (a, b). Volviendo a usar la regia de la cadena, podemos cal- 
cular las derivadas X\z ) e Y'(z) sin un conocimiento exph'cito de X(z) e Y(z). 
Introduzcamos para ello dos nuevas funciones / y g por medio de las ecuaciones 

/(z) = F[X{z), Y (z), z] y g(z) = G [X(z), Y(z), z]. 

Entonces /(z) = g(z) = 0 para todo z de (a, b) y por tanto las derivadas /'(z) 
y g'(z) tambien son cero en (a, b). Con la regia de la cadena esas derivadas se 
expresan con las formulas 


dF dF 

f\z) = f X\z) + ^ Y'(z) + 
ox ay 


dF 

dz 


g '(z) = f-X\z) + f-Y\z) + f-. 
ox by dz 


Puesto que /'(z) y g'(z) son ambas cero podemos determinar X'(z) e Y'(z) resol¬ 
viendo el siguiente sistema de ecuaciones litieales: 


y X'(Z) + y Y'(z) = - 
dx by 


dF 
dz ’ 


f X\z) + f Hz) - 
bx by 


dG 

dz 


En aquellos puntos en los que el determinante del sistema no es nulo, el sistema 
tiene una sola solution que, mediante la regia de Cramer, se puede expresar asf: 


dF 

dF 


dF 

dF 

dz 

dy 


dx 

dz 

dG 

dG 


dG 

dG 

dz 

dy 

, Y'(z) = - 

dx 

dz 

dF 

dF 

dF 

dF 

dx 

dy 


dx 

dy 

dG 

dG 


dG 

dG 

dx 

dy 


dx 

dy 


(9.24) 


X\z) = - 
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Los determinantes que aparecen en (9.24) son determinantes de matrices de 
Jacobi y se llaman determinantes jacobianos. Con frecuencia se emplea una nota- 
cidn especial para los determinantes jacobianos. Escribimos 


g(/i, 

d(x x .r n ) 


= det 


d A d A ... A 

dx 1 dx 2 dx„ 


A d A ... A. 

_dx l dx 2 dx n _ 


Con esta notacion, las formulas (9.24) pueden expresarse mas brevemente en la 
forma 


(9.25) 


X ' (z) = w G W(y’ z ) y'(z) = d(F > G)ld(z ’ x) 

3(F, G)/d(x, y)’ 3(F, G)/d(x, y ) ' 


(El signo menos se ha incorporado a los numeradores permutando las columnas.) 

El metodo se puede extender a casos mas generates en los que se dan m ecua- 
ciones con n variables, siendo n > m obteniendose m variables en funcion de 
las n — m restantes. Las derivadas parciales de las nuevas funciones asf defini- 
das se pueden expresar como cocientes de determinantes de Jacobi, generalizando 
asi (9.25). En el ejercicio 3 de la seccion 9.8 se da un ejemplo en el que m — 2 
yn = 4. 


9.7 Ejemplos resueltos 

En esta seccion ilustramos algunos de los conceptos de la anterior resolviendo 
algunos problemas relativos a funciones definidas implicitamente. 

ejemplo 1 . Supongamos que la ecuacion g(x, y) = 0 determina y como 
tuncion derivable de x, sea esta y = Y(x) para todo x en un cierto intervalo (a, b). 
Expresar la derivada Y\x) en funcion de las derivadas parciales de g. 

Soiucion. Sea G(x) = g[x, Y(x)] para x en (a, b). Entonces la ecuacion 

g(x, y) — 0 implica G(x) = 0 en (a, b). En virtud de la regia de la cadena 
tenemos 


G'(x) = ^-l + |l r(x) 
dx By 



364 


Aplicaciones de calculo diferencial 


de la que obtenemos 
(9.26) 


Y'(x) = 


dg/dx 

dg/dy 


en los puntos x de (a, b) en los que dg/dy ¥= 0. Las derivadas parciales dg/dx 
y dg/dy vienen dadas por las formulas dg/dx = Dig[x, Y(x)] y dg/dy = D 2 g 
lx, Y(x)]. 

ejemplo 2. Cuando se elimina y entre las dos ecuaciones z = fix, y) y 
g(x, y) = 0, el resultado puede expresarse en la forma z = h(x). Expresar la deri- 
vada h'(x) en funcion de las derivadas parciales de / y g. 

Solution. Supongamos que la ecuacion gix, y) = 0 puede resolverse res- 
pecto a y en funcion de x y que una solution sea y — Y(x) para todos los valores 
de x de un cierto intervalo abierto ( a, b). Entonces la funcion h sera 


h(x) = f[x, Y (x)] si x e (a, b ). 

Aplicando la regia de la cadena tenemos 

h'(x) = f + f Y '(x). 
ox ay 


Con la ecuacion (9.26) del ejemplo 1 obtenemos la formula 


h\x) = 


dy dx 8y dx 
dg 
dy 


Las derivadas parciales del segundo miembro estan calculadas en el punto (x, Y(x)). 
Observese que el numerador tambien puede expresarse como un determinante 
jacobiano, resultando 


h'(x) = 


3(f, g)/d(x, y) 
dg/dy 


ejemplo 3. Las dos ecuaciones 2x = v* — u 2 e y = uv definen u y v como 
funciones de x e y. Hallar las fdrmulas correspondientes &du/dx,duldy,dv/dx,dvldy. 

Solution. Si mantenemos fija y y derivamos las dos ecuaciones citadas con 
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respecto a x, recordando que u y v son funciones de x e y, obtenemos 


„ . dv « du 

2 = 2v — - 2u — y 
ox ox 


. dv du 

0 =u t, + t* 


Resolviendo estas ecuaciones respecto a du/dx y dv/dx encontramos 

u ov v 


du 

dx 


u 2 + p 2 


y 


dx u 2 + p 2 


Por otra parte, si mantenemos fija x y derivamos las dos ecuaciones dadas res¬ 
pecto a y obtenemos las ecuaciones 


n _ 3 p » du 
0 = 2v — - 2u — y 
dy oy 

De este sistema de dos ecuaciones obtenemos 


1 dv du 

1 - u r y +v r,- 


du 


dy m 2 + p 2 


y 


dy m 2 + p 2 


ejemplo 4. Sea u una funcion de x e y definida por la ecuacion 


u = F(x + u,yu). 

Hallar du/dx y du/dy en funcion de las derivadas parciales de F. 

Solucion. Supongamos que u — g(x, y) para todo (x, y) en un cierto con- 
junto abierto S. Sustituyendo g(x,y) por u en la ecuacion original obtenemos 


(9.27) 


g(x,y) = FKfx.y), u 2 (x,y)]. 


en donde u,(x, y) = x + g(x, y) y u 2 (x, y) = y g(x, y). Mantengamos ahora y 
fija y derivemos ambos miembros de (9.27) respecto a x, empleando la regia de 
la cadena en el segundo miembro, con lo que obtenemos 


(9.28) 


— = t>,F ~ + D t F — 
dx dx dx 


Pero dujdx = 1 + dg/dx, y du 2 /dx = y dg/dx . Luego (9.28) se convierte en 


^ = D X F 
dx 
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Resolviendo esta ecuacion respecto a dg/dx (y poniendo dujdx en lugar de dg/dx) 
obtenemos 


du _ -DJ 

dx + y D 2 F — 1 

Del mismo modo encontramos 


d -Z= Dl F^ 

dy dy 


+ D 2 F^ = D.F^ + D 2 F 
ay ay 


(4 


+ 



Esto nos conduce a la ecuacion 

du _ -g(x, y) D 2 F 

dy D X F + y D 2 F — 1 


Las derivadas parciales DjF y D 2 F estan calculadas en el punto (x + g(x, y), 
yg(x, y )). 

ejemplo 5. Cuando u se elimina entre las dos ecuaciones x = u + v e 
y = uv 2 llegamos a una ecuacion de la forma F(x, y, v) = 0 que define implici- 
tamente v como funcion de x e y, sea v = h{x, y). Demostrar que 

dh = h(x, y) 
dx 3h(x, y) — 2x 

y encontrar una formula analoga para dh/dy. 

Solution. Eliminando u entre las dos ecuaciones dadas, obtenemos la re¬ 
lation 


xv 2 — v 3 — y — 0. 

Sea F la funcion definida por la ecuacion 

F(x, y, v) = xv 2 — v 3 — y. 

Podemos aplicar ahora lo dicho en la section 9.6 y escribir 
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Pero dF/dx = v' 1 , dF/dv = 2xv — 3d 2 y dFjdy — — 1. Luego las formulas (9.29) 
se convierten en 


dh 

dx 

dh 

dy 


v 


2xv - 3v 2 

-1 


h(x, y ) 


2x — 3v 3h(x, y) — 2x 
1 


2xv — 3v 2 2xh(x, y) — 3 h\x, y) 


ejemplo 6 . La ecuacion F(x, y, z) = 0 define implfcitamente z como fun- 
cion de x e y, sea z = f(x, y). Suponiendo que d 2 Fj(dx dz ) = d 2 F/(dz dx), de- 
mostrar que tenemos 


(9.30) ^ = 

dx 2 


\9z 2 / \dx/ \dxdzj \dz] \dxj \dzj \dx 2 J 


/3F' 3 

\3z 


)' 


donde las derivadas parciales del segundo miembro estan calculadas en 
(x, y, f(x, y)). 

Solution. Segun la formula (9.20) de la seccion 9.6 tenemos. 


(9.31) 


df 

dx 


dF/dx 

dF/dz 


Hay que recordar que este cociente significa en realidad 

_ DiF[x, y,f(x, y)] 

D 3 F[x, y,f(x, y)j 

Introduzcamos G(x, y) = DJlx, y, f(x, y)] y Fl(x, y) = D 3 F[x, y, f(x, y)]. Nos 
proponemos calcular la derivada parcial respecto a x del cociente 


d l 

dx 


G(x, y) 
H(x, y) ’ 


manteniendo la y fija. Aplicando la regia de la derivacion de un cociente resulta. 
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Puesto que G y H son funciones compuestas, usamos la regia de la cadena para 
calcular las derivadas parciales dG/dx y dHjdx. Para dG/dx tenemos, 


— = D^D.F) • 1 + D^D.F) • 0 + D 3 {DJ) ■ %- 
dx dx 

= &L d * F g / 

dx 2 3 4 dz dx dx 


Analogamente, encontramos 


^ = D 1 (D 3 F) • 1 + D 2 (D 3 F) • 0 + D 3 (D 3 F) ■ t~ 
dx dx 

_ d 2 F d*F df_ 

dx dz dz 2 dx 


Sustituyendo en (9.32) y reemplazando df/dx por el cociente (9.31) obtenemos 
la formula (9.30). 

9.8 Ejercicios 


En los ejercicios de esta seccion se supone la existencia y la continuidad de todas las 
derivadas que intervienen. 

1. Las dos ecuaciones x + y = uv y xy = u — v definen x e y como funciones implicitas 

de u y v, sean estas x = X(u, v) e y = Y(u, v). Demostrar que dXj du =(xv — 1)1 (x — y) 

si x y, y hallar formulas parecidas paradX/dv, dYjdu, dY/dv. 

2. Las dos ecuaciones x + y = uvyxy = u — v definen x y v como funciones de u e y, 

sean estas x = X(u, y) y v = V(u, y). Demostrar que dX/du = (u + v )/(l+ yu) si 

1 + yu 0, y hallar las formulas de dX/dy, B Vj du, dV/dy. 

3. Las dos ecuaciones F(x, y, u, v)=0 y, G(x,y, u, v) = 0 determinan x e y como funciones 
implicitas de u y v, sean estas x — X(u, v) e y = Y(u, v). Demostrar que 

dX d(F, G)l B(y, u) 
du d(F,G)l3(x,y) 

en los puntos en los que el jacobiano d(F, G)/d(x, y) # 0, y hallar las formulas para 
las derivadas parciales dX/dv, dY/du y dY/dv. 

4. La interseccion de las dos superficies dadas por las ecuaciones cartesianas 2x I + 3y 2 — z 1 = 
= 25 y x 2 +y 2 = z z contiene una curva C que pasa por el punto P = (VT3,4). Esas 
ecuaciones pueden resolverse respecto a x e y en funcion de z con lo que se obtiene la 
representacion parametrica de C con z como parametro. 

a) Hallar un vector unitario T tangente a C en el punto P sin utilizar el conocimiento 
explfcito de la representacion parametrica. 

b) Confrontar el resultado del apartado anterior a) mediante la representacion para¬ 
metrica de C con z como parametro. 
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5. Las tres ecuaciones F(u, v) = 0, u = xy y v = V x 2 + z 2 definen una superficie en el espa- 
cio xy z. Hallar un vector normal a esa superficie en el punto x = 1, y = 1 , z — VT si 
se sabe que D 1 F( 1,2) = 1 y DiF(l,2) = 2. 

6. Las tres ecuaciones 


x 2 — y cos («t>) + z 2 = 0, 
x 2 + y 2 — sen (uv) + 2 z 2 = 2, 
xj — sen u cos v + z = 0 , 

definen x, y, z como funciones de u y v. Calcular las derivadas parciales 3x/ 3u y 3x13v 
en el punto x = y = 1, u = -njl , v = 0, z = 0. 

7. La ecuacidn /( y/x, z/x) = 0 define z implfcitamente como funcion de x e y, sea esa 
funcion z = g(x, y). Demostrar que 

x i +y %-&•*> 

en los puntos en los que Difiy/x, g(x, y)/x] es distinta de cero. 

8. Sea F una funcion real de dos variables reales y supongamos que las derivadas parciales 
DiF y DJF son siempre distintas de cero. Sea u otra funcion real de dos variables reales 
tales que las derivadas parciales 3u/3x y 3u/3y estan ligadas por la ecuacidn F( 3uj 3x, 
Sul 3y) = 0. Demostrar que existe una constante n tal que 

3 2 u 3 2 u / 3 2 u \” 

3x 2 3y 2 \3x 3y) ’ 

y encontrar it. Suponer que 3 2 u/(3x 3y) = 3 2 uj ( 3y 3x). 

9. La ecuacion x + z + (y + z) 2 = 6 define z como funcidn implfcita de x e y, sea 
z = fix, y). Calcular las derivadas parciales 3ffdx, 3f\dy, y S 2 //(3x 3y) en funcidn de 
x,y, y z. 

10. La ecuackSn sen (x + y) + sen (y + z) = 1 define z como funcidn implfcita de x e y, 
sea z = fix, y). Calcular la derivada segunda D,,if en funcidn de x, y,.y z. 

11. La ecuacidn F(x + y + z,x 2 + y 2 + z 2 ) = 0 define z como funcion implfcita de x e y, 
sea z = fix, y). Determinar las derivadas parciales 3f/3x y 3f/3y en funcion de las par¬ 
ciales DiF y DiF. 

12. Sean / y g dos funciones de una variable real y definamos F(x,y) = f[x + g(y)]. Hallar 
las formulas correspondientes a todas las derivadas parciales de F de primero y segundo 
orden, expresadas en funcion de las derivadas de / y g. Comprobar la relacidn 

3F 3 2 F 3F 3 2 F 

3x 3x 3y 3y 3x 2 * 


9.9 Maximos, minimos y puntos de ensilladura 

Una superficie definida explxcitamente por una ecuacion de la forma 
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z = fix, y) puede considerarse como una superficie de nivel del campo escalar F 
definido por la ecuacion 


F(x,y,z) = fix, y) - z. 


Si / es diferenciable, el gradiente de ese campo viene dado por el vector 


ox oy 


La ecuacion lineal que representa el piano tangente en un punto Pi = {x X) y u zj 
puede escribirse en la forma 


en la que 


z - z x = A(x - x-i) + B{y-y x ), 

A = DJ{ Xl ,y x ) y B = D i f(x 1 , 7l ). 


Cuando los dos coeficientes A y B son nulos, el punto P t se llama punto esta- 
cionario de la superficie y el punto (x u yO se llama punto estacionario o critico 
de la funcion /. El piano tangente en un punto estacionario es horizontal. Gene- 
ralmente los puntos estacionarios de una superficie se clasifican en tres catego- 
rias: maximos, minimos y puntos de ensilladura. Si la superficie se imagina como 
un terreno montanoso, esas categorias corresponden, respectivamente, a las cum- 
bres, a los fondos de los valles y a los puertos. 

Los conceptos de maximos, mfnimos y puntos de ensilladura, se pueden in- 
troducir para campos escalares cualesquiera definidos en subconjuntos de R n . 


definicion. Se dice que un campo escalar f tiene un maximo absoluto en 
un punto a de un conjunto S de R“ si 


(9-33) f(x) <,f{a) 

para todo x de S. El numero f(a ) se llama maximo absoluto de f en S. Se dice 
que la funcion f tiene un maximo relativo en a si la desigualdad (9.33) se satisfa- 
ce para todo x de una cierta n-bola B{a) contenida en S. 

Dicho de otro modo, un maximo relativo en a es el maximo absoluto en un 
cierto entorno de a. El minirno absoluto y el minimo relativo se definen de modo 
parecido, empleando la desigualdad opuesta a la (9.33). Algunas veces se emplean 
los adjetivos global y local en lugar de absoluto y relativo respectivamente. 

definicion. Un numero que sea maximo relativo o minimo relativo de 
f se llama extremo de f. 
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Si / tiene un extreme en un punto interior a y es diferenciable en el, todas 
las derivadas parciales de primer orden DJ(a ),.... D„f(a) deben ser cero. Es 
decir, V f(a) = O (Esto se puede probar facilmente manteniendo fijo cada com- 
ponente y reduciendo el problema al caso uni-dimensional). En el caso n = 2, 
esto significa que hay un piano horizontal tangente a la superficie z = f(x, y) en el 



y 



a) z = 2 — x' 2 — y- 


b) Curvas de nivel: x* + y 2 = c 


Ejemplo 1. Maximo relativo en el origen. 
z 



c) Z = X- +/- 


Ejemplo 2. Mlnimo relativo en el origen. 
Figura 9.3 Ejemplos 1 y 2. 
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punto («,/(«)). Por otra parte, es sencillo encontrar ejemplos en los que la anu- 
lacion de todas las derivadas parciales en a no implica necesariamente un extremo 
en a. Esto sucede en los llamados puntos de ensilladura que se definen del modo 
siguiente. 

definici6n. Supongamos que f sea diferenciable en a. Si V f(a) = O el 
punto a se llama punto estacionario de f. Un punto estacionario se llama de ensi¬ 
lladura si toda n-bola B(a ) contiene puntos x tales que f{x) <f{a)y otros para 
los que f(x) >/(«).. 

La definicion es analoga a la del caso uni-dimensional en el que los puntos 
estacionarios de una funcion se clasifican en maximos, minimos y puntos de in¬ 
flexion. En los ejemplos que-siguen se consideran varios tipos de puntos estacio¬ 
narios. En cada caso el punto estacionario que se considera es el origen. 

ejemplo 1. Maximo relativo. z = f(x, y) = 2 — x 2 — y 2 . Esta superficie 
es un paraboloide de revolucion. En las proximidades del origen tiene la forma 
indicada en la figura 9.3 a). Sus curvas de nivel son circulos, alguno de los cuales 
esta dibujado en la figura 9.3 b). Puesto que f \x, y) — 2 — (x 2 + y 2 ) < 2 = 
= /(0, 0) para todo (x, y), resulta que / no tan solo tiene en (0,0) un maximo 
relativo, sino tambien un maximo absoluto en todo conjunto que contenga el ori¬ 
gen. Las dos derivadas parciales 3 f/dx y 3 f/dy se anulan en el origen. 

EJEMPLO 2. Minimo relativo. z = f(x, y) = x 2 + y 2 . Este ejemplo, otro 
paraboloide de revolucion, es en esencia el mismo que el ejemplo anterior, salvo 
que en el origen hay un minimo en lugar de un maximo. El aspecto de la super¬ 
ficie en las cercanias del origen se aprecia en la figura 9.3 c) y algunas curvas 
de nivel estan dibujadas en la figura 9.3 b). 

ejemplo 3. Punto de ensilladura. z —f (x,y) = xy. Esta superficie es un 
paraboloide hiperbolico. Cerca del origen es parecida a una silla de montar, como 
se ve en la figura 9.4 (a). Las dos derivadas parciales df/dx y df/dy son nulas 
en el origen pero no existe en el ni maximo ni minimo. En efecto, para puntos 
(x, y) del primero o tercer cuadrantes, x e y tienen el mismo signo, dandonos 
f(x, y) > 0 = /(0, 0), mientras que para puntos del segundo y cuarto cuadrantes 
* e y tienen signos opuestos, y es /(*, y) < 0 = /(0,0). Por consiguierite, en todo 
entorno del origen hay puntos en los que la funcion es menor que/(0, 0) y puntos 
en los que es mayor que /(0,0), de modo que el origen es un punto de ensilia- 
dura. En la figura 9.4 b), se representa tambien el punto de ensilladura y las 
curvas de nivel eh las proximidades de (0, 0). Esas son hiperbolas que tienen los 
ejes x e y como asintotas. 
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Figura 9.4 Ejemplo 5. Punto de ensilladura en el origen. 

ejemplo 4. Punto de ensilladura. z = fix, y) = X s — 3xy 2 . Cerca del ori¬ 
gen, esta superficie tiene el aspecto de un puerto de montana entre tres picos. 
Esta representada en la figura 9.5 a). Algunas curvas de nivel se ven en la figu¬ 
ra 9.5 b). El punto de ensilladura esta en el origen. 




Figura 9.5 Ejemplo 4. Punto de ensilladura en el origen. 
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ejemplo 5. Mmimo relativo. z — f(x, y) = x 2 y 2 . Esta superficie se parece 
a un valle circundado por cuatro montanas, como sugiere la figura 9.6 a). Existe 
un mi'nimo absolute en el origen, ya que f(x, y ) > (/(0,0) para todo (x, y). Las 
curvas de nivel [representadas en la figura 9.6 b)] son hiperbolas cuyas asintotas 
son los ejes xey. Observese que esas curvas de nivel son parecidas a las del 
ejercicio 3. En este caso, no obstante, la funcion toma unicamente valores no ne¬ 
gatives a lo largo de todas sus curvas de nivel. 


y 



X 

a) - = x-y- b) Curvas de nivel: x 2 y 2 = c 


Figura 9.6 Ejemplo 5. Mmimo relativo en el origen. 



a) r _ 1 - a- b) Curvas de nivel: 1 — x 2 — c 


Figura 9.7 Ejemplo 6. Maximo relativo en el origen. 
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ejemplo 6. Maximo relativo. z = {fix, y) = 1 — x 2 . En este caso la su- 
perficie es un cilindro con generatrices paralelas al eje y, como muestra la figura 
9.7 a). Las secciones por pianos paralelos al eje x son parabolas. Es evidente que 
existe un maximo absoluto en el origen debido a que fix, y) = 1 — x 2 ^l =/(0,0) 
para todo (x, y). Las curvas de nivel forman una familia de rectas paralelas como 
se ve en la figura 9.7 b). 

9.10 Formula de Taylor de segundo orden para campos escalares 

Si un campo escalar diferenciable f tiene un punto estacionario en a, la 
naturaleza de este queda determinada por el signo algebraico de la diferencia 
f(x ) — /(a) para x proximo a a. Si x — a + y, tenemos la formula de Taylor de 
primer orden 

/(« + y) —/(a) = V/(a) • y + ||j?|| E(a, y), donde E(a, y)-+ 0 cuando y-* O 
En un punto estacionario, V/(a) = O y la formula de Taylor toma la forma 

f(a+y)-f(a)= ||j>|| E(a,y). 

Para determinar el signo algebraico de /(a + j>) — /(a) necesitamos mas infor- 
macion relativa al termino de correccion ||jil E{a,y). El teorema que sigue nos 
dice que si / tiene en a, derivadas parciales de segundo orden continuas, el ter¬ 
mino de correccion o complementary es igual a la forma cuadratica, 

n n 

z 2 2 D «/(«)yiy# 

1 i =1 i =1 

mas un termino de orden menor que ||j'H 2 . Los coeficientes de la forma cuadra¬ 
tica son las derivadas parciales de segundo orden Daf = Di(Djf), calculadas en a. 
La matriz nXn de las derivadas segundas D,,/(jc) es la llamada matrix hessiana (*) 
y se designa por H(x). Asf pues, tenemos 

H(x) = [D a f(x)]* jml 

con tal que existan las derivadas. La forma cuadratica puede escribirse mas sen- 
cillamente en forma matricial como sigue: 

2 2 Duf(d)y i y j = yH(d)y*, 

1 i=l 


(*) De Ludwig Otto Hesse (1811-1874), matematico aleman autor de muchas contri 
buciones a la teoria de superficies. 
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en donde y = (y lt ... ,y„) se considers como una matriz fila 1 Xn, e y* es su 
transpuesta, una matriz columna nXl. Cuando las derivadas parciales A,/ son 
continuas tenemos A,/ = A,/ y la matriz H(a} es simetrica. 

La formula de Taylor que da una aproximacion cuadratica para f(a + y)~ 
/(a), toma ahora la siguiente forma. 

TEOREMA 9.4. F6RMULA DE TAYLOR DE SEGUNDO ORDEN PARA CAMPOS ES- 

calares. Si f es un campo escalarcon derivadas parciales segundas Dyf conti¬ 
nuas en una n-bola B(a), entonces para todo y de R n tal que a + y e B(a) 
tenemos 


(9.34) f(a + y) — f (a) = V/(a) • y + ^ j/7(a + cy)y\ donde 0 < c < 1. 
Esto puede escribirse tambien en la forma 


(9.35) f{a + y) - /(«) = V/(a) • y + ^ yH(a)y ( + Wyf £*(«, y), 


en donde E 2 (a, y) -> 0 cuando y O. 

Demostracion. Mantengamos y fijo y definamos g(u) para u real mediante la 
ecuacion 


g(u) =/(« + uy) para -1 <, u <> 1. 

Entonces /(a + j>) — /(a) = g( 1) — g(0). Demostraremos el teorema aplicando la 
formula de Taylor de segundo orden a e en el intervalo [0,1]. Obtenemos 

(9.36) g(l) — g(0) = g'(0) + g"(c), donde 0<c<l. 

Aquf hemos utilizado para el resto la forma de Lagrange (vease la seccion 7.7 del 
Volumen I). 

Puesto que g es una funcion compuesta dada por g(u) = f[r(u)], siendo 
r(u) — a + uy podemos calcular su derivada mediante la regia de la cadena. 
Tenemos r'(u) =.y asf que la regia de la cadena nos da 

g'(«) = V/[r(u)] • r'(u) = V/[r(u)] y = J DJ[r(u)]y t , 

l 
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con tal que r(u) e B(a) . En particular, g'(0) = V/(«) • y. Aplicando una vez mas 
la regia de la cadena encontramos 

g"(«) = I D^ZDJlrWIy)* = f lD ij f[r(u)]y i y j = yH[r(u)]y *. 

<=1 \i=l / * =1 » =1 

Luego g"(c) = yH(a + cy)y*, con lo que la ecuacion (9.36) se transforma en la 
(9.34). 

Para demostrar (9.35) definamos £,(«,jOpor la ecuaciOn 
(9.37) Ibll 2 E t (a, y) = — y{ H ( a + c ^) - si y * ° > 

y sea E 2 (a, O) — 0. Entonces la ecuacion (9.34) toma la forma 

/(a +y)~ /(«) = V/(«) • y + jj yH(a)y‘ + Ibll 2 E 2 (a, y). 

Para completar la demostracion necesitamos probar que E 2 (a,y)-^- 0 cuando 
y-O. 

De (9.37), obtenemos 

H I W ■ W 

lb|| 8 |E 2 (a, y)\ = - J 2 ( D o/(« + <y) “ D tj f(a)}y iyj 

^ t =1 y=l 
1 n , w 

£-,221-D«/(« + O') - Ai/(«)l Ibll 2 . 

Z i=l i =l 

Dividiendo por Ibll 8 obtenemos la desigualdad 

i£ 2 («, ^)i <; - 221 D ^ a +<*> - *>«/(«) 1 

Z i=l 1=1 

para y ^ O. Puesto que cada derivada parcial segunda £>,,/ es continua en a, 
tenemos Duf(a + cy)-*■ D tj f(a) cuando y~+0, asf que E 2 (a, y) -> 0 cuando 
y-+ O. Esto completa la demostracion. 
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9.11 Determinacion de la naturaleza de un punto estacionario por medio de los 
autovalores de la matriz hessiana 

En un punto estacionario tenemos V/(a) = O , asi que la formula de Taylor 
de la ecuacion (9.35) toma la forma 

/(« + y)~ f(a) = iyH(a)y t + ||y || * E 2 (a, y). 

Puesto que el termino de correction ||j|| 2 E 2 (a, y) tiende hacia cero mas rapida- 
mente que Ibll 2 , parece razonable pensar que para y pequeno el signo algebraico 
de f(a -f j) — /(a) es el mismo que el de la forma cuadraticaj’//(a)j';por lo que 
la naturaleza del punto estacionario podra determinarse mediante el signo alge¬ 
braico de la forma cuadratica. Esta section se dedica a demostrar este hecho. 

Damos primero una conexion entre el signo algebraico de una forma cuadra¬ 
tica y sus autovalores. 

teorema 9.5. Sea A = [a#] una matriz nXn simetrica, y pongamos 
Q(y) = yAy* = 2 

i=i i 


Tenemos entonces: 

a) Q(y) > 0 para todo y O si y solo si todos los autovalores de A son 
positivos. 

b) QCf) < 0 para todo y ^ O si y sdlo si todos los autovalores de A son 
negativos. 


Observacidn. En el caso a), la forma cuadratica se llama definida positiva; en el 
caso b) se llama definida negativa. 

Demostracion. En virtud del teorema 5.11 existe una matriz ortogonai C 
que reduce la forma cuadratica yAy* a forma diagonal. Esto es 

(9.38) Q(y) = yAy * = | A,x 2 

1=1 


donde x — (x l , .... x n ) es la matriz fila x = yC, y ..., son los autovalores 
de A. Los autovalores son reales puesto que A es simetrica. 

Si todos los autovalores son positivos, la ecuacion (9.38) pone de manifiesto 
que Q(y) > O' siempre que x ^ O. Pero como x = yC, tenemos y = x C*' 1 , por 
lo que x 3 * O, si y sdlo si y ^ O. En consecuencia Q(y) > 0 para todo y O. 
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Reciprocamente, si Q(y) > 0 para todo y ¥= O podemos elegir y de mode 
que x = yC es el Jc-esimo vector coordenado e k . Para este y, la ecuacion (9.38) 
nos da Q(y) = X k , de modo que cada A k > 0. Esto demuestra la parte a). La de- 
mostracion de b) es analoga. 

El teorema que sigue relaciona la naturaleza de un punto estacionario con 
el signo algebraico de la forma cuadratica yH(a)y l . 

teorema 9.6. Sea f un campo escalar con derivadas parciales segundas 
continuas Dijf en una n-bola B(a ), y designemos con H(a ) la matriz hessiana en 
un punto estacionario a. Tenemos entonces: 

a) Si todos los autovalores de H{a) son positivos, f tiene un minimo re¬ 
lative* en a. 

b) Si todos los autovalores de H(a) son negativos, f tiene un maximo re- 
lativo en a. 

c) Si H(a ) tiene autovalores positivos y negativos, f tiene un punto de en- 
silladura en a. 

Demostracion. Pongamos Q(y) = yH (a)y i . La formula de Taylor nos da 

(9.39) /(a + y)~ /(a) = \Q(y) + y ||» 2? 2 («, y), 

en donde E 2 (a, y*) ->■ 0 cuando y.-*- O. Vamos a demostrar que existe un numero 
positivo r tal que, si 0 < ||y*|| < r, el signo algebraico de f(a + y) — f(a) es el 
mismo que el de Q(y). 

Supongamos primero que todos los autovalores A 1 ,..., A„ de H(a) son posi¬ 
tivos. Sea h el autovalor mas pequeno. Si u < h, los n numeros 

A„ — u 

son tambi6n positivos. Esos numeros son los autovalores de la matriz real sime- 
trica H(a) — ul, siendo / la matriz identidad nXn. Segun el teorema 9.5, la for¬ 
ma cuadratica y[H(a) — ul]y‘ es definida positiva, y por tanto y[H(a) — ul]y ( > 0 
para todo y ^ O . Por lo tanto 

yH(a)y* > y{ul)y* = u ]|y|| 2 

para todo valor real u < h. Tomando u = \h obtenemos la desigualdad 

Q(y) > \h IlyP 

para todo y ^ O. Puesto que E 2 (a, y)->- O cuando y~>-0, existe un numero 
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positivo r tal que \E 2 (a,y)\ < \h con tal que 0 < |bll < r. Para tal y tenemos 

0 ^ lbII 2 \E 2 (a,y)\ < ih |bll 2 < 
y la fdrmula de Taylor (9.39) demuestra que 

/(« + y) -/(«) ^ *<200 - lbII 2 l^(a,^)l > 0. 


Por consiguiente / tiene un mmimo relativo en a, lo que demuestra la parte a). 
Para probar b) podemos utilizar un razonamiento parecido, o aplicando simple- 
mente la parte a) a —/. 

Para demostrar c), sean ^ y A 2 dos autovalores de H(a) de signos opuestos. 
Pongamos h = min {1^1, |Aa|}. Entonees para cada valor real u que satisfaga 
—h < u < h los numeros 


K — « y h — u 

son autovalores de signos opuestos de la matriz H(a ) — ul. Por consiguiente, si 
u e ( - h, h), la forma cuadratica y[H(a) - ul]y* toma valores positivos y ne¬ 
gatives en todo entorno de y — O. Elijamos, como antes, r > 0 de modo que 
\ E z{“,y)\ < \h siempre que 0 < |bII < r ■ Razonando, entonees, como antes ve- 
mos que para tal y el signo de /(a + y) — /(a) es el mismo que el de Q(y). 
Puesto que para y ->■ O , se presentan valores positivos y negativos, / tiene en a 
un punto de ensilladura. Esto completa la demostracion. 


Observacidn: Si todos los autovalores de H(a) son cero, el teorema 9.6 no 
nos da informacidn relativa al punto estacionario. Se pueden dar criterios, para 
tratar tales ejemplos, en los que intervienen derivadas de orden superior, pero no 
los expondremos aquf. 


9.12 Criterio de las derivadas segundas para determinar extremos de funciones 
de dos variables 

En el caso n = 2 la naturaleza del punto estacionario se puede determinar 
tambien mediante el signo algebraico de la derivada segunda y del 

determinante de la matriz hessiana. 


teorema 9.7. Sea a un punto estacionario de un campo escalar f(x 1 , x s ) 
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con derivadas parciales segundas continuas en una 2-bola B(a). Designemos con 


y sea 


A = D ul f(d ), B = D lt f(a ), C = D^f{a ), 


A = det H (a) = det 


'A 
B 


B~ 

C 


= AC- BK 


Tenemos entonces: 

a) Si A < 0, / tiene un punto de ensilladura en a. 

b) Si A > 0 y A > 0, f tiene un minimo relativo en a. 

c) Si A > 0 y A < 0, f tiene un maximo relativo en a. 

d) Si A = 0 el criterio no decide nada. 

Demostracidn. En este caso la ecuacion caracteristica det [A/ — H(a)] = 0 
es cuadratica, 

A 2 — (A + C)A + A = 0. 

Los autovalores K, K estan ligados a los coeficientes por las ecuaciones 

Xi + = A + C, = A. 

Si A < 0 los autovalores tienen signos opuestos, asi que / tiene un punto de ensilla¬ 
dura en a, lo que prueba a). Si A > 0, los autovalores tienen el mismo signo. En 
este caso AC > B 2 > 0, asi que A y C tienen el mismo signo. Este signo debe ser 
el de kt y K ya que A + C = ^ + K- Esto demuestra b) y c). 

Para demostrar d) nos referiremos a los ejemplos 4 y 5 de la seccion 9.9. En 
ambos tenemos A = 0 en el origen. En el ejemplo 4 el origen es un punto de ensilla¬ 
dura, y en el ejemplo 5 es un minimo relativo. 

Aun cuando sea aplicable el teorema 9.7 puede ocurrir que no sea este el ca- 
mino mas sencillo para determinar la naturaleza de un punto estacionario. Por 
ejemplo, cuando f(x, y) = e 1/9(x ‘ v \ en donde g(x, y) = x 2 + 2 + cos 2 y — 2 cos y, 
el criterio es aplicable, pero los calculos son muy largos. En este caso podemos 
expresar g(x, y) como una suma de cuadrados escribiendo g(x, y) = 1 + x 2 + 
4 - (1 — cos y ) 2 . En seguida vemos que / tiene maximos relativos en los puntos en 
los que x 2 — 0 y (1 — cos y) 2 = 0. Estos son los puntos (0, 2mr), siendo n un en- 
tero cualquiera. 

9.13 Ejercicios 

En los ejercicios del 1 al 15, identificar y clasificar (si existen) los puntos estacionarios 
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de las superficies que tienen las ecuaciones cartesianas que se dan. 


1. z = x 2 + iy - l) 2 . 

2. z = x 2 - iy - l) 2 . 

3. z = 1 + x 2 

4. z = (x - y + l) 2 . 

5. z — 2x 2 - xy - 3y 2 - 3x + ly. 

6. z — x 2 — xy + y 2 — 2x + y. 

13. z =senxsenysen(x +y), 0 <, x 

14. z = x — 2y + log yjx 2 + y 2 + 3 arctan 

15. z = (x 2 + y 2 )e~ (xi+y,) . 


7. z = y? — 3 xy 2 + y 3 . 

8. z =*y(6 -x -y). 

9. z = x 3 + j 3 - 3xj. 

10. z = sen x cosh/. 

11. z - e 2x+3y (Sx 2 - 6 xy + 3/). 

12. z = (5x + 7y - 25)e-< x,+xv+y,) . 
”, 0 <,y <, it. 

V 

x>0. 


16. Sea j(x, y) = 3x‘ — 4x ! y + y 2 . Demostrar que sobre toda recta de la forma y = mx la 
funcidn tiene un mi'nimo en (0,0), pero que no existe mfnimo relativo en ningun entomo 
bidimensional del origen. Hacer un dibujo indicando el conjunto de puntos (x, y) en los 
que f(x, y) > 0 y el conjunto en el que }(x, y) < 0. 

17. Sea f(x, y) - (3 - x)(3 - y)(x + y - 3). 

a) Trazar una figura indicando el conjunto de puntos (x, y) en los que fix, y) > 0. 

b) Hallar todos los puntos (x, y) del piano en los que Dif(x, y) = D 2 f(x, y) = 0. 
llndicacidn. D t f(x, y) contiene (3 — y) como factor.] 

c) iCuales de los puntos estacionarios son maximos relativos? iCuales son mfnimos 
relativos? iCuales ni una cosa ni otra? Razonar las contestaciones. 

d) iTiene / un mfnimo absoluto o un maximo absoluto en todo el piano? Razonar la 
contestacion. 

18. Determinar todos los valores extremos absolutos y relativos y los puntos de ensilladura 
para la funcion fix, y) = xy(l — x 1 — y 2 ) en el cuadrado 0<x< l,0<y< 1. 

19. Determinar las constantes a y b para que la integral 


j^{ax +b - f(x)} 2 dx 


tome el valor menor posible si a) fix) = x 2 ; b) fix) — (x 2 + l)-‘. 

20. Sea fix, y) = Ax 2 + 2 Bxy + Cy 2 + 2 Dx + 2 Ey + Fen donde A > 0 y B 2 < AC. 

a) Demostrar que existe un punto (Xi.y,) en el que / tiene un mfnimo. [ Indicacidn. 
Transformar la parte cuadratica en una suma de cuadrados.] 

b) Demostrar que/(^i, 7 x) = Dx x + Ey x + F en ese mfnimo. 

c) Demostrar que 


A* fji) 


l 

AC - B 2 


A B D 
BCE 
D E F 


21. MStodo de los mmimos cuadrados. Dados n numeros distintos x ,...,x n y otros n nu- 
meros yi,..., y„ (no necesariamente distintos), es en general imposible encontrar una 
recta fix) - ax + b que pase por todos los puntos lx,, y,), esto es, tal que fix,) =y, para 
cada i. No obstante, podemos encontrar una funcidn lineal con la que el «error cua- 
dratico total» 


n 


Eia,b)=^\fix i )-y i f 

t=l 
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sea minimo. Determinar los valores de a y b para que eso ocurra. 

12. Extender el metodo de los mi'nimos cuadrados a £»• Esto es, hallar una funcion lineal 
f(x, y) = ax + by + c que minimice el error cuadratico total 

E (a, b,c) =2 [/"(*<. yd ~ . 

i=X 

donde ( x t , y.) son n puntos distintos dados y Zi.z„ son n numeros reales dados. 

23. Sean Zi,..., z„ n puntos distintos en un m-espacio. Si x e R™, definamos 

f(x) - 2 ll* - **ll 2 - 

1 U 

Demostrar que f tiene un minimo en el puntoa = - ^ z k (centroide). 

k=l 

24. Sea a un punto estacionario de un campo escalar / con derivadas parciales segundas en 
una n-bola B(a). Demostrar que / tiene un punto de ensilladura en a si por lo menos 
dos elementos de la diagonal principal de la matriz hessiana H(a) tienen signos opuestos. 

25. Comprobar que el campo escalar f(x, y, z) = x* + y* + z* — 4xyz tiene un punto esta¬ 
cionario en (1,1,1), y determinar la naturaleza de ese punto estacionario calculando los 
autovalores de su matriz hessiana. 


9.14 Extremos condicionados. Multiplicadores de Lagrange 

Iniciamos esta seccion con dos ejemplos de problemas de extremos condi¬ 
cionados. 

ejemplo 1. Dada una superficie S que no pase.por el origen, determinar los 
puntos de S mas proximos al origen. 

ejemplo 2. Si f(x,y,z) representa la temperatura en (x,y,z), determinar 
los valores maximo y minimo de la temperatura en una curva dada C del espacio 
de tres dimensiones. 

Ambos ejemplos son casos particulares del siguiente problema general: De¬ 
terminar los valores extremos de un campo escalar f(x) cuando x tiene la restric- 
cidn de pertenecer a un subconjunto dado del dominio de f. 

En el ejemplo 1 el campo escalar cuyo minimo se desea es la funcidn distancia, 
f(x,y, z ) = (* 2 + y* + z*)*; 

el subconjunto restringido es la superficie dada S. En el ejemplo 2 tal subconjunto 
es la curva dada C. 
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Con frecuencia los problemas de extremos condicionados son muy diffciles; 
no se conoce un metodo general para resolverlos con toda generalidad. Se utilizan 
metodos particulares cuando el subconjunto restringido tiene una estructura sen- 
cilia, por ejemplo, si es una superficie como en el ejemplo 1, o una curva como en 
el ejemplo 2. Esta seccion esta dedicada al metodo de los multiplicadores de La¬ 
grange para resolver tales problemas. Ante todo exponemos el metodo en su 
forma general, y luego damos argumentos geometricos para comentar su aplicacion 
a los dos ejemplos antes mencionados. 

Metodo de los multiplicadores de Lagrange. Si un campo escalar j(x Xt .. ., x„) 
tiene un extremo relativo cuando esta somelido a m condiciones, por ejemplo 

(9.40) gi(xi,... ,x n ) = 0, ... , g m (x lt . .. , x n ) = 0, 

siendo m < n, existen entonces m escalares X lt . .., A m tales que 

(9.41) V/= V gl + • • • -f A m Vg m 

en cada punto extremo. 

Para determinar los puntos extremos en la practica consideramos el sistema 
de n + m ecuaciones formado con las m ecuaciones de condicion (9.40) y las n 
ecuaciones escalares determinadas por la relacion vectorial (9.41). Se resuelve 
el sistema (si ello es posible) respecto a las n + m incognitas x 1 ,...,x„ y 
K, ■■■ > A m . Los puntos (x x ,..., x n ) en los que se presentan los extremos relativos 
se encuentran entre las soluciones de aquel sistema. 

Los escalares \ x ,... ,\ m que se introdujeron para ayudarnos a resolver este 
tipo de problema se denominan multiplicadores de Lagrange. Se introduce un 
multiplicador por cada condicion. El campo escalar / y las funciones de condicion 
gi, • • •, gm se suponen diferenciables. El metodo es valido si el numero de condi¬ 
ciones, m, es menor que el numero de variables, n, y si no todos los determinantes 
jacobianos de las funciones de condicion con respecto a m de las variables 
x x ,... ,x„ son nulos para los valores extremos que se consideran. La demostra- 
cion de la validez del metodo es un resultado importante del calculo superior y 
no la expondremos aquf. (Vease el capi'tulo 7 de la obra del autor Analisis mate- 
matico, Editorial Reverte, S. A., Barcelona, Buenos Aires, Caracas, Mexico. En lu- 
gar de ello daremos unos argumentos geometricos para hacer ver el significado del 
metodo y como se aplica en los dos ejemplos que al principio se han citado. 

Solucion geometrica del ejemplo 1. Queremos determinar los puntos de una 
superficie dada S que estan mas proximos al origen. Un punto (x, y, z) del espacio 
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de tres dimensiones esta a distancia r del origen si y solo si esta en la esfera 

x 2 + y 2 + z 2 = r 2 . 

Esta esfera es una superficie de nivel de la funcion f(x, y, z ) = ( x 2 + y 2 + z 2 ) I/: 
que hay que minimar. Si empezamos con r — 0 y aumentamos r hasta que la 
correspondiente superficie de nivel sea tangente a la superficie dada S, cada punto 
de contacto sera un punto de S lo mas proximo al origen. 

Para determinar los puntos de contacto suponemos que S esta definida por 
la ecuacion cartesiana g(x, y, z) = 0. Si S tiene piano tangente en un punto de 
contacto, dicho piano tambien debe ser tangente a la superficie de nivel tangente 
a S en el mismo punto. Por lo tanto el vector gradiente de la superficie 
g(x, y, z) = 0 debe ser paralelo al vector gradiente de la superficie de nivel de 
contacto f(x, y, z) = r. Por tanto existe una constante A tal que 

Vf(x,y,z) = A Vg(x,y, z) 

en cada punto de contacto. Esa es la ecuacion vectorial (9.41) lograda con el 
metodo de Lagrange cuando hay una sola condicion. 

Solution geometrica del ejemplo 2. Queremos obtener los valores extremos 




c 


Figura 9.8 Los vectoresVg v Vg 2 y V/ estan Figura 9.9 El vector gradiente V/ esta en 
situados en el mismo piano. un piano normal a C. 
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de una funcion que da la temperatura f(x, y, z ) sobre una curva dada C. 
Si consideramos la curva C como la interseccion de dos superficies, 

gi(x,y, z) = 0 y g 2 (x,y,z) = 0, 

tenemos un problema de extremos con dos condiciones. Los dos vectores gradien- 
tes Vg x y Vg 2 son normales a esas superficies, luego tambien lo son a la curva 
C de interseccion. (Ver figura 9.8). Seguidamente demostramos que el vector gra- 
diente V/ de la funcion temperatura tambien es normal a C en cada extremo re- 
lativo sobre C. Elio implica que V f esta en el mismo piano que Vg x y Vg 2 ; luego 
si Vg x y Vg 2 son independientes podemos expresar V / como combination lineal 
de Vg x y Vg 2 , es decir 

v/= A 1 Vg 1 + ;. 2 Vg 2 . 


Esta es la ecuacion vectorial (9.41) obtenida con el metodo de Lagrange cuan- 
do existen dos condiciones. 

Para demostrar que V/ es normal a C en un punto extremo imaginemos 
que C este definida por una funcion vectorial a(t), variando t en un intervalo 
[a, b ]. Sobre la curva C la temperatura se convierte en una funcion de t, es decir 
(p(t) — /[a(f)J. Si <p tiene un extremo relativo en un punto interior de[a, b] 
tiene que verificarse <p'(ti) = 0. Por otra parte, la regia de la cadena nos dice que 
(p\t) viene dada por el producto escalar 

<P'(0 = V/[a(/)]* «'(/)• 

Este producto es nulo en t u luego V/ es perpendicular a o'(<)• Pero o'(L) es tan- 
gente a C, por lo que V/ [a(/j)] esta en el piano normal a C, como muestra la 
figura 9.9. 

Los dos vectores gradientes Vg x y V & son independientes si y solo si su 
producto vectorial es no nulo. Este producto viene dado por 


i j k 


Vgi x Vg 2 = 


dgi dgi dg t 
dx dy dz 


dg 2 dg 2 dg 2 
dx dy dz 


d (s i » ga) . , d(gi, g 2 ) . , g(gi, g 2 ) , 

d(y, z ) d(z, x) d(x, y) 


Por consiguiente, la independencia de Vg x y Vga significa que no todos los de 
terminantes jacobianos del segundo miembro son cero. Como ya hemos observado. 
el metodo de Lagrange es aplicable siempre que esta condicion se satisfaga. 
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Si Vgj y Vg 2 son dependientes el metodo puede fallar. Por ejemplo, supon- 
gamos que intentamos la aplicacion del metodo de Lagrange para encontrar los 
valores extremos de f(x, y, z) = x* -Fy 1 2 en la curva de intersection de las dos 
superficies gAx, y, z) = 0 y g 2 (x, y, z) = 0 siendo gi(x, y,z) = z y gAx, y, z) <== 
z * _ (y _ l) 3 4 5 . Las dos superficies, un piano y un cilindro, se cortan a lo largo 
de la recta C dibujada en la figura 9.10. El problema tiene evidentemente una 


z 



Figura 9.10 Ejemplo en el que el metodo de Lagrange no es aplicable. 

solution, debido a que f(x, y, z) representa la distancia del punto (x, y, z) al eje z 
y esta distancia es un mfnimo sobre C cuando el punto es el (0, 1,0). Sin em¬ 
bargo, en este punto los vectores gradientes son Vg x = k, Vg 2 = O , y V/= 2j, 
y esta claro que no existen escalares A.j y A 2 que satisfagan la ecuacion (9.41). 

9.15 Ejercicios 

1. Hallar los valores extremos de z = xy con la condicidn x + y = 1. 

2. Hallar las distancias maxima y minima desde el origen a la curva 5x* + 6xy + 5y 2 = 8. 

3. Supongamos que a y b son numeros positivos fijos. 

a) Hallar los valores extremos de z = x/a + y/b con la condici6n x 2 + y 2 = 1. 

b) Hallar los valores extremos de z= x 2 + y 2 con la condici6n x/a + y/b = 1. 

En cada caso, interpretar geometricamente el problema. 

4. Hallar los valores extremos de z — cos 2 x + cos 2 y con la condicidn x — y — ir/A. 

5. Hallar los valores extremos del campo escalar f(x, y,z) = x — 2y + 2z en la esfera 
x 2 + y 2 + z 2 = 1. 
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6. Hallar los puntos de la superficie z 2 — xy = 1 mis prdximos al origen. 

7. Hallar la minima distancia desde el punto (1,0) a la parabola y 2 = 4x. 

8. Hallar los puntos de la curva de intersecci6n de las dos superficies 

x 2 — xy + y 2 - z 2 = l y x 2 + y 2 = 1 

que estdn mas pr6ximos al origen. 

9. Si a, b y c son numeros positivos, hallar el valor maximo de f(x, y, z) = x a y b z c con la 
condition x + y + z = 1. 

10. Hallar el volumen mfnimo limitado por los pianos x = 0, y = 0, z = 0, y un piano 
que sea tangente al elipsoide 



en un punto del octante x > 0, y > 0, z > 0. 

11. Hallar el m£ximo de log* + logy + 3 logz en la porcidn de la esfera x 2 + y 2 + z 2 — 5r* 
en la que * > 0, y > 0, z > 0. Aplicar el resultado para demostrar que para numeros 
reales positivos a, b, c tenemos 

, W£27 (i±i±f)‘. 

12. Dada la seccidn cdnica Ax 2 4- 2Bxy + Cy 2 = 1, siendo A > 0 y B 1 < AC. Represente- 
mos con m y M las distancias minima y maxima desde el origen a los puntos de la 
cdnica. Demostrar que 

nf# A + C + \J {A - C) 2 + 4 B 2 
2(AC - B 2 ) 

y hallar una fdrmula analogs para m 2 . 

13. Aplicar el metodo de los multiplicadores de Lagrange para hallar las distancias maxi¬ 
ma y minima de un punto de la elipse x 1 + 4/ = 4 a la recta x + y = 4. 

14. La section de un canal es un trapecio isdsceles. Si los lados iguales de ese trapecio 
miden c metros, £cual debe ser el dngulo que forman 6stos con el fondo (base menor 
del trapecio) si queremos que el area de la section sea maxima? 


9.16 Teorema del valor extremo para campos escalares continuos 

El teorema del valor extremo para funciones reales continuas en un intervalo 
acotado y cerrado puede extenderse a campos escalares. Consideremos campos 
escalares continuos en un intervalo ^-dimensional cerrado. Tal intervalo se de¬ 
fine como el producto cartesiano de n intervalos uni-dimensionales cerrados. Si 
a — > • • • > On) y b = (&!,..., b„) escribimos 

[a, b ] = fa, M X • • • X [a n ,b n ] = {(x ls . .., x n ) | 6 [a lt 6J,... , 6 [a n , b n ]}. 
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Por ejemplo, cuando n = 2 el producto cartesiano [a, A ] es un rectangulo. 

La demostracion del teorema del valor extremo es paralela a la demostra¬ 
cion dada en el volumen I para el caso unidimensional. Demostramos primero que 
la continuidad de f implica la acotacion, luego probamos que f alcanza efectiva- 
mente sus valores maximo y mmimo en [a, b]. 

TEOREMA 9.8. TEOREMA DE ACOTACldN PARA CAMPOS ESCALARES CONTINUOS. 
Si f es un campo escalar continuo en cada punto de un intervalo cerrado [a, b] 
de R n , entonces f es acotada en [a, A]. Esto es, existe un ntimero C> 0 tal que 
j/(r)|< C para todo x de [a. A]. 

Demostracidn. Razonemos por reduction al absurdo, utilizando el metodo de 
la biseccion sucesiva. La figura 9.11 representa el metodo para el caso n — 2. 

Supongamos que / no este acotada en [a, A]. Pongamos / (1) = [a. A] e 
Z* 1 ’ = [a k ,b k ], as! que 

jd) = i\ v X ••• X I™. 

Dividamos en dos partes iguales cada intervalo unidimensional I™ formando 
dos subintervalos, la mitad izquierda I { k )\ y la mitad derecha /£>. Considere- 
mos ahora todos los productos cartesianos posibles de la forma 



Figura 9.11 Representation en el piano del metodo de la bisectidn sucesiva. 
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en donde cada /, = 1 6 2. Existen exactamente 2” productos de este tipo. Cada 
uno de ellos es un subintervalo n-dimensional de [a. A], y su reunion es igual a 
[a, A]. La funcion / no esta acotada en uno por lo menos de esos subintervalos 
(si estuviera acotada en cada uno de ellos tambien estarfa en [a. A]). Designemos 
por / (2) uno de ellos que expresamos del modo siguiente 

I (2) = l{ 2) x • • • x 1™, 

en donde cada I k 2> es uno de los subintervalos unidimensionales de / (I) de 
longitud \{b k - a k ). * 

Seguidamente hacemos con / ,2 > lo mismo que con I w , bisecamos cada com- 
ponente unidimensional / k 2> y llegamos a un intervalo n-dimensional en el 
que / no esta acotada. Prosiguiendo este proceso, obtenemos un conjunto infinito 
de intervalos n-dimensionales 

I n) , / <2) , . . . , tales que f(m+ 1) <— J(m) 

en cada uno de los cuales f no esta acotada. El intervalo m-esimo / (m) puede ex- 
presarse en la forma 


/ <m) = /{ m) x • • • x I (m) 

Como quiera que cada intervalo unidimensional I { k m> se obtiene mediante m — 1 
bisecciones sucesivas de [a*, bk], si escribimos l { k m] = [a ( k m> , b { k m) ] tenemos 


(9.42) 


i (m) _(i 

bk a k 


(m) 


bk a k 

2 m-l ’ 


para k = 1, 2,. .., n. 


Para cada k fija, el extremo superior de todos los extremos izquierdos a[ m) (m = 
1,2,...) debe ser igual al extremo inferior de todos los extremos derechos b[ m> 
(m = 1, 2,...), y designamos su valor comun con t k . El punto t — (t, ,... ,**„) 
esta contenido en [a. A], En virtud de la continuidad de / en t existe una n-bola 
B(t; r) en la que tenemos 

l/C*) — fit )I < 1 para todo x de B(t; r) n [a, A]. 

Esta desigualdad implica 

l/(*)l < 1 + |/(t)l para todo x d eB(t; r) n [a, b ], 
con lo que / no esta acotada en el conjunto B(t; r) n [a. A]. Pero este conjunto 
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contiene todo el intervalo / (m > cuando m es lo bastante grande para que cada uno 
de los n numeros (9.42) sea menor que r/ Vn. Por consiguiente para ese valor de 
m la funcion / no esta acotada en / (m) , lo que esta en contradiccion con el hecho 
de que / esta acotada en / (m) . Con ello se completa la demostracion. 

Si / esta acotada en [a, A], el conjunto de todos los valores j(x) es un con- 
junto de numeros reales acotado superior e inferiormente. Por consiguiente ese 
conjunto tiene un extremo superior y un extremo inferior que designamos con 
sup / e inf /, respectivamente. Esto es, escribimos 

sup/ = sup {/(*) | xe [a, A]} , inf/ = inf {/(or) | * e [a. A]} . 

Ahora vamos a demostrar que una funcion continua alcanza los valores inf / y 
sup f en [a, A], 

TEOREMA 9.9. TEOREMA DEL VALOR EXTREMO PARA CAMPOS ESCALARES. Si 
f es continua en un intervalo cerrado [a, A] de R”, entonces existen puntos c y d 
en [a, A] tales que 


f(c) = sup / y f{d) = inf/. 

Demostracion. Basta demostrar que f alcanza su extremo superior en [a, A], 
El resultado para el extremo inferior se deduce como una consecuencia debido 
a que el extremo inferior de / es el extremo superior de —/. 

Pongamos M — sup /. Supondremos que en [a, A] no existe ningun x para 
el que fix) = M y obtendremos una contradiccion. Pongamos g(x) = M — f(x). 
Para todo x de [a, A] es entonces g(x) > 0 de modo que la funcion reci'proca 
1/g es continua en [a, A], begun el teorema de acotacion, 1/g esta acotada en 
[a, A], sea \/g(x) < C para todo x de [a, A], siendo C > 0. Esto implica que 
M — f{x) > 1/C, con lo que f(x) < M — 1/C para todo x de [a, A]. Esto con- 
tradice el hecho de que M es la menor cota superior de / en [a, A], Luego 
fix ) = M para un x por lo menos de [a, A]. 

9.17 Teorema de la continuidad uniforme para campos escalares continuos 

Sea / continua en un intervalo cerrado acotado [a, A] en R B , y designemos 
con Mif) y m(f), respectivamente, los valores maximo y mmimo de / en [a, A], 
La diferencia 


M (/) - m(J) 

se llama oscilacion de f en [a, A], Como en el caso unidimensional tenemos un 
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teorema de la oscilacidn uniforme para funciones continuas, que nos dice que 
en el intervalo [a, b ] puede efectuarse una particion de modo que la oscilacion 
de / en cada subintervalo sea tan pequena como se quiera. 

Pongamos [a, b] = [s,, bj X ... X \_a n , 6„], y sea Pk una particion del 
intervalo [a*, &*]. Esto es, Pk es un conjunto de puntos 

Pk {*0 > X 1 > • • • ) x r-l > x r} 

tales que a* = x 0 < x 1 < ... < x r _, ^ x r = bk. El producto cartesiano 

P = P 1 x ■ ■ • x P n 

se denomina particion del intervalo [«, A] . El teorema de la oscilacion uniforme 
se suele llamar de la continuidad uniforme, y toma la siguiente forma. 

teorema 9.10. Si f es un campo escalar continuo en un intervalo cerradc 
[a, b] de R n , entonces para todo e > 0 existe una particidn de [a, b] en un nu- 
mero finito de subintervalos tales que la oscilacidn de f en todo subintervalo es 
menor que e. 

Demostracion. La demostracion es del todo analoga al caso unidimensional, 
as! que unicamente esbozamos los principales pasos. Razonamos por reduccion 
al absurdo, con el metodo de la biseccion sucesiva. Suponemos que el teorema es 
falso; esto es, suponemos que para un cierto e 0 en el intervalo [a, b] no puede 
efectuarse una particion en un numero finito de subintervalos en cada uno de los 
cuales la oscilacion de / es menor que e 0 . Por biseccion sucesiva obtenemos un 
conjunto infinito de subintervalos / (1) , /< 2) ,..., en cada uno de los cuales la 
oscilacion de / es por lo menos e 0 . Considerando la menor cota superior de los 
extremos izquierdos de los intervalos componentes de. / (1) , / (2) ,.... obtenemos 
un punto t de (a, A] perteneciente a todos estos subintervalos. En virtud de la 
continuidad de / en / existe una n-bola B(t; r) tal que la oscilacidn de / es menor 
que !<r„ en B(t;r ) n [a,b]. Pero, cuando m es suficientemente grande, el inter¬ 
valo I <m) esta contenido en el conjunto B(t; r) n [a, b ], por lo que la oscilacidn 
de / no supera a |e 0 en / (m) , lo que esta en contradiccion con el hecho de que la 
oscilacidn de / es por lo menos e 0 en 7 (m> . 
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10.1 Introduction 

En el volumen I estudiamos la integral Si /(*) dx > primero para funciones 
reales definidas y acotadas en intervalos finitos, y luego para funciones no acota- 
das e intervalos infinitos. Posteriormente el concepto se extendio a funciones 
vectoriales y, en el capitulo 7 del volumen II, a funciones matriciales. 

Este capitulo extiende la notion de integral en otra direction. El intervalo 
[a, b] se reemplaza por una curva en el espacio n-dimensional definida por una 
funcion vectorial o, y el integrando es un campo vectorial / definido y acotado 
en esa curva. La integral que resulta se llama integral de linea, integral curvili- 
nea o integral de contorno, y se emplea para ella la notation //• da o algun otro 
simbolo parecido. El punto se usa precisamente para sugerir el producto interior 
de dos vectores. La curva se llama camino de integracion. 

Las integrates de linea son de capital importancia en Matematica pura y 
aplicada. Se presentan al estudiar el trabajo, la energia potential, el flujo de 
calor, el cambio en la entropia, la circulation de un fluido, y otras cuestiones 
fisicas en las que se estudia el comportamiento de un campo escalar o vectorial 
a lo largo de una curva. 

10.2 Caminos e integrates de linea 

Antes de definir las integrates de linea recordemos la definition de curva 
dada en el volumen I. Sea a una funcion vectorial definida en un intervalo cerrado 
finito / = [ a , b], Cuando t va tomando los valores de /, la funcion a (t) describe 
un conjunto de puntos en el n-espacio llamado grafica de la funcion. Si a es 
continua en / la grafica se llama curva; con mayor precision, es la curva descrita 
por a. 

En nuestro estudio de las curvas en el volumen I vimos que funciones dis- 
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tintas pueden onginar el trazado de la misma curva en formas distintas, por ejem- 
plo, en direcciones distintas o con velocidades distintas. A1 estudiar las integrales 
de linea nos interesa no solo el conjunto de puntos de una curva sino la manera 
como tal curva ha sido originada, esto es, la funcion a. Una tal funcion se llama- 
ra camino continuo. 

definici6n. Sea J = [a, b] un intervalo cerrado finito de R 1 . Una fun- 
cion a:J—> R” continua en J se llama camino continuo en el n-espacio. El camino 
se llama regular si existe la derivada a' y es continua en el intervalo abierto (a, b). 
El camino se llama regular a trozos si el intervalo [a, 6] puede descomponerse en 
un numero finito de subintervalos en cada uno de los cuales el camino es regular. 

La figura 10.1 muestra la grafica de un camino regular a trozos. En este 
ejemplo la curva tiene recta tangente en todos los puntos excepto en un numero 
finito de ellos. Esos puntos excepcionales subdividen la curva en arcos, a lo largo 
de cada uno de los cuales la recta tangente va cambiando de posicion con conti- 
nuidad. 



Figura 10.1 Grafica de un camino regular a trozos en el piano. 

definicion de integral de LfNEA. Sea a un camino regular a trozos en 
el n-espacio definido en un intervalo [a, &], y sea f un campo vectorial definidp 
y acotado sobre la grafica de a. La integral de linea de f a lo largo de a se repre- 
senta con el simbolo § f - day se define por 

(10.1) //• da = j*f[a(t)] ■ a'(0 dt, 

siempre que la integral del segundo miembro exista, bien como integral propia 
o integral impropia. 

Observacidn: En muchos ejemplos que en la practica se presentan el pro- 
ducto interior/[o(f)] • o'(/)estd acotado en [a, f>] y es continuo excepto, acaso, 
en un numero finito de puntos, en cuyo caso la integral existe como integral propia. 


10.3 Otras notaciones para las integrales de linea 


Si C representa la grafica de a, la integral de linea //• da tambien se repre- 
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senta por J c /- da. y se llama integral de f a lo largo de C. 

Si a = a (a) y b = a(b) representan los puntos extremos de C, a veces la 
integral de linea se expresa poniendo / o/J/- da y se denomina integral de 
linea de / desde a a A a lo largo de a. Cuando se use la notation J* / debera te- 
nerse en cuenta que la integral depende no solamente de los extremos a y b sino 
tambien del camino a que los une. 

Cuando a = b el camino se llama cerrado. A menudo el simbolo § se usa 
para indicar la integration a lo largo de un camino cerrado. 

Cuando / y a se expresan en funcion de sus componentes, a saber 

/=(/!,... ,/„) y «=(«!,..., a n ), 

la integral del segundo miembro de (10.1) se convierte en una suma de integrales, 

2 />(0K(0 dt. 

k=l a 

En este caso la integral de linea tambien se pone en la forma / f 1 da t /„ da n . 

En el caso bi-dimensional ordinariamente el camino o se define con un par 
de ecuaciones param6tricas. 


x — a i(0> 7 = a 2 0). 

y la integral de lineaj c /- da se escribe en la forma $cfidx+f 2 dy, o bien 
$cfi(x,y)dx + f 2 (x, y) dy. 

En tres dimensiones se utilizan tres ecuaciones parametricas 
x — ®i(0) J = « 2 (0. z = « 3 (0 

y ponemos la integral J c /• da en la forma $ c f x dx + / 2 dy + / s dz , o bien 
j c fi(x, y, z) dx + f 2 (x,y, z) dy + f 3 (x, y, z) dz. 
ejemplo. Sea / un campo vectorial de dos dimensiones dado por 
fix, y) = y/yi+ (x 3 + y)j 

para todo ( x, y) con y > 0. Calcular la integral de linea de / desde (0, 0) a (1, 1) 
a lo largo de cada uno de los siguientes caminos: 

a) la recta de ecuaciones parametricas x — t, y = t, 0< f < 1; 

b) el camino de ecuaciones parametricas x = t 2 , y = t 3 , 0 < f < 1. 
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Solucidn. Para el camino de la parte a) tomamos a (t) = ti + tj. Entonces 
a'(?) = i +j y /[<*(/)] =z Jt i + (t 3 + t)j. Por consiguiente el producto interior 
de /[a(?)] por a'(0 es igual a VI + t 3 + t y encontramos 

f <11) /‘ da = P Qt + t 3 + t)dt= X -l. 

J (o,o) Jo 12 

Para el camino de la parte b) tomamos <*(/) = t 2 i + t 3 j. Entonces a'(t) = 
= 2 ti + 3t 2 j y/[a(/)] = t- 4 i + (0 + t 3 )j .Por consiguiente 

/[a(f)J • a'(t) = + 3t 8 + 3f 5 , 

as * ^ ue rn i) i 

I f da = f (2 1 5 * + 3 t s + 31 5 ) dt = —. 

J(o,o) Jo 42 

Estos ejemplos ponen de manifiesto que la integral desde un punto a otro puede 
depender del camino que los une. 

Calculemos ahora la parte b) una vez mas, utilizando la misma curva pero 
con representacion parametrica distinta. Dicha curva puede representarse con la 
funcion 


0(/) = ti + t%j, donde 0 < t < 1. 
Esto nos lleva a la relacion 


/[0(OJ • 0'(O = (/*/ + (t 3 + t H )j) • (i +1 t' A j) = t y ‘ + i yA + It 2 , 


cuya integral desde 0 a 1 es 59/42, como antes. Esto nos hace ver que el valor 
de la integral es independiente de la representacion parametrica utilizada para la 
curva. Esta es una propiedad general de las integrales de linea que se demuestra 
en la seccion siguiente. 

10.4 Propiedades fundamentales de las integrales de linea 

Puesto que las integrales de linea se definen en funcion de integrales ordina- 
rias, no debe sorprender que aquellas gocen de muchas de las propiedades de 
estas. Por ejemplo, tienen la propiedad de linealidad respecto al integrando, 


J (af + bg) ■ da = a j f- da + b J g ■ da 
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y la propiedad aditiva respecto al camino de integration: 

Sc f ' da = S Cl f ' da + lcj' da ’ 

donde las dos curvas C 1 y C 2 forman la curva C. Esto es, C es la grafica de una 
funcion a definida en un intervalo [a, b~\, v las curvas C, y C 2 son las represen- 
taciones graficas dea(/) al variar t en los subintervalos [a, c] y [c, b] respectiva- 
mente, para un c que cumple a < c < b. Las demostraciones de estas propieda¬ 
des son consecuencia inmediata de la definition de la integral de linea; y las de- 
jamos como ejercicios para el lector. 

Seguidamente examinamos el comportamiento de las integrates de linea al 
efectuar un cambio de parametro. Sea a un camino continuo definido en un inter¬ 
valo [a, b], sea u una funcion real derivable, de modo que u' nunca sea cero en 
un intervalo [c, d], y tal que el recorrido de u sea la,b]. Entonces la funcion 
P definida en [c, d] por la ecuacion 

(5(0 = a[w(01 

es un camino continuo que tiene la misma grafica que a. Dos caminos a y (3 asi 
relacionados se llaman equivalentes. Se dice que proporcionan distintas representa- 
ciones parametricas de la misma curva. Se dice que la funcion u define un cambio 
de parametro. 



Figura 10.2 Cambio de pardmetro definido por u = h(t). En a), la funcidn h conserva 
la orientacidn. En b), la funcidn h invierte la orientacidn. 
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Sea C la grafica comun de los dos caminos equivalentes a y (3. Si la derivada 
de u es siempre positiva en [c, d] la funcion u es creciente y decimos que los dos 
caminos a y (3 originan C en la misma direccion. Si la derivada de u es siempre 
negativa decimos que a y (3 originan C en direcciones opuestas. En el primer caso 
se dice que u conserva la orientacion; y en el segundo caso que u invierte la orien- 
tacidn. En la figura 10.2 se muestra un ejemplo. 

El teorema siguiente demuestra que una integral de linea no varia al efectuar 
un cambio de parametro que conserva la orientacion; cambia de signo si el cambio 
de parametro invierte la orientacidn. Se supone que existen las dos integrales 
J/daejY-dp 

TEOREMA 10.1. COMPORTAMIENTO DE UNA INTEGRAL DE LINEA FRENTE A 
un cambio de parametro. Si a y /3 son dos caminos equivalentes regulares 
a trozos, entonces se tiene 

L f - lc f- 

si a y (3 originan C en la misma direccion; y 

si a y (3 originan C en direcciones opuestas. 

Demostracidn. Basta demostrar el teorema para caminos regulares; luego se 
aplica la propiedad aditiva con respecto al camino de integracion para deducir el 
resultado para caminos regulares a trozos. 

La demostracidn es una simple aplicacion de la regia de la cadena. Los ca¬ 
minos a y (3 estan ligados por una relacion de la forma (3(/) = a[u(t)], estando u 
definida en un intervalo [c, d] yo en un intervalo [a, b]. De la regia de la ca¬ 
dena resulta 


P'(0 = a'[u(t)]u'(t). 

Por consiguiente encontramos 

Jc f' d P = Se • P'(0 dt = J c V(a[w(t)]) • a'[u(t)]u'(t) dt . 

En la ultima integral hacemos la sustitucion v = u(t), dv = u'(t) dt y se obtiene 

Sc f ~ d P = S;"f(«(v)) ■ «'(») dv=± jjia(v)) ■ a \v) dv = ±/ c /• da, 



El concepto de trabajo como integral de llnea 


399 


en donde se utiliza el signo + si a = u(c) y b = u(d), y el signo — si a = u(d) 
y b = u(c). El primer caso se presenta si o y /3 originan C en la misma direccion, 
el segundo si originan C en direcciones opuestas. 


10.5 Ejercicios 


En cada uno de los ejercicios 1 al 8 calcular la integral de lfnea del campo vectorial 

/ a lo largo del camino que se indica. 

1. fix, y ) = ( x 2 — 2xy)i + (y 2 — 2xy)j, a lo largo de la parabola y = x 2 desde (—1,1) 
„a (1,1). 

2. f(x,y) = (2 a — y)i + xj, a lo largo del camino descrito por a(f) = ait — sen t)i + 
a( 1 — cos tjj, 0 <, t <,2 it. 

3. f(x,y, z) — (y 2 z 2 )i + 2 yzj — x 2 k, a lo largo del camino descrito por a(/) = ti 
+ t 2 j + t 3 kK 0<f<l.j 

4. fix, y) = (x 2 + y 2 )i + (x 2 - y 2 )j ., a lo largo de la curva y = 1 - |1 -x|, desde (0,0) 
a (2 ’ 0) - 

5- f{x,y ) = (x + y)i + (x — y)j, alrededor de la elipse b 2 x 2 + a 2 y 2 = a 2 b 2 en sentido 
oontrario al de las agujas del reloj. 

6 - f(x,y,z) =2 xyi + (x 2 + z)j + yk, desde (1,0,2) a (3,4,1) a lo largo de un seg- 
mento de recta. 

7- f{x,y,z) = xi + yj + (xz — y)k ,desde (0,0,0) a (1,2,4) a lo largo de un segmento 
rectilineo. 

8. f(x, y, z) = xi + yj + (xz — y)k, a lo largo del camino dado por a(t) = t 2 i + 2 tj + 
4 t 3 k , 0 < t < 1. 


En cada uno de los ejercicios 9 al 12, calcular el valor de la integral de lfnea dada. 


9. Sc ~ 2xy) dx + (y 2 — 2xy) dy siendo C el arco de parabola y = x 2 que une 
los puntos (—2,4) y (1,1). 
f (x + y)dx — (x — y) dy 

10. J c - x2 + y Z - donde C es la circunferencia x 2 + f = a 1 , recorrida en 


11 


sentido contrario al de las agujas del reloj. 
dx + dy 


• J, 


c \x\ + \y | 


donde C es el contomo del cuadrado de vertices (1,0), (0,1), (-1,0) y 


(0, — 1), recorrido en sentido contrario al de las agujas del reloj. 

12. j c y dx + zdy + x dz, donde 

a) C es la curva de interseccion de las dos superficies x + y = 2 y x J + y 2 + z 2 = 
= 2(x + y). La curva es recorrida de tal modo que mirando desde el origen el sentido 
es el de las agujas del reloj. 

b) C es la interseccion de las dos superficies z — xy y x 2 + y 2 == 1, recorrida en senti¬ 
do, que visto desde encima del piano xy, es el contrario al de las agujas del reloj. 


10.6 El concepto de trabajo como integral de llnea 

Consideremos una particula que se mueve a lo largo de una curva bajo la 
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accion de un campo de fuerzas /. Si la curva es la grafica de un camino a, regular 
a trozos, el trabajo realizado por / se define por la integral de linea //• da. Los 
ejemplos siguientes ponen de manifiesto algunas de las propiedades fundamentales 
del trabajo. 

ejemplo 1. Trabajo realizado por una fuerza constante. Si/es una fuer- 
za constante, a saber f — c , puede demostrarse que el trabajo realizado por / al 
mover una particula desde un punto a a un punto b a lo largo de cualquier camino 
regular a trozos que una ay b es c ■ (b — a) producto de la fuerza por el despla- 
zamiento b — a. Lo demostraremos en un caso particular. 

Sea a = a n ) un camino que una a y b, a saber a (a) = a y a (b) = b, 

y escribamos c — (c u . . . , c„). Supongamos que a' es continua en [a, b]. Entonces 
el trabajo realizado por / es igual a 

| /• da. = j[c k P a'.(t) dt = 2 c k [y. k (b) - a A .(a)j = c • [a(fc) - a(a)j = c • (b - a). 

‘ /.-=1 " 7 )f=l 

Para este campo de fuerzas el trabajo depende solamente de los puntos extre- 
mos a y b y no de la curva que los une. No todos los campos de fuerza tienen 
esta propiedad. Los que la tienen se llaman conservatives. El ejemplo de la pa- 
gina 395 es un campo de fuerzas no conservative. En una seccion posterior deter- 
minaremos todos los campos de fuerzas conservatives. 

ejemplo 2. Principio del trabajo y la energia. Una particula de masa m 
se mueve a lo largo de una curva bajo la accion de un campo de fuerzas /. Si la 
velocidad de la particula en el instante t es v(t), su energia cinetica esta definida 
por J mv 2 (t). Demostrar que la variacion de la energia cinetica en cualquier inter- 
valo de tiempo es igual al trabajo realizado por f durante dicho intervalo de tiempo. 

Solucidn. Designemos por r(t) la posicion de la particula en el instante t. 
El trabajo realizado por / durante un intervalo de tiempo [a, b] es \ r r { b a \f-dr. 
Queremos demostrar que 


rm 

jr(a) /" dr = lmv (b) - imv 2 (a). 
Segun la segunda ley del movimiento de Newton tenemos 

/WO] = mr"{t) = mv'(t), 


donde v(t) designa el vector velocidad en el instante t. La velocidad es la longi- 
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tud del vector velocidad, v(t) = IKOII • Por consiguiente 

f[r(t)\ ■ r'(t) = /[r(0]' KO = mv'(t) • v(t) = y (v(t) ■ v(t)) = -|m ~ (v 2 (t)). 

clt at 

Integrando entre a y b obtenemos 

dr = f/WO] ' f'(0 dt = |wy 2 (f)| a = |wu 2 (/7) - \mv\a), 
como queriamos probar. 


10.7 Integrates de linea con respecto a la longitud de arco 

Sea a un camino con derivada a' continua en un intervalo [a, b]. La grafica 
de a es una curva rectificable. En el volumen I se demostro que la correspondiente 
funcion longitud de arco s, esta dada por la integral 

s (0 = JJ ||«'(u)|| du. 

La derivada de la longitud de arco tiene por valor 

s\t)= ||o'(OII • 

Sea <p un campo escalar definido y acotado en C, la grafica de a. La integral 
de linea de cp con respecto a la longitud de arco a lo largo de C se representa con el 
simbolo $c yds y se define por 

J c ( P ds = y[a(r)]s'(0 dt, 

siempre que exista la integral del segundo miembro. 

Consideremos ahora un campo escalar y dado por <p[a(r)] =/[a(0]‘ T (>) 
que es el producto interior de un campo vectorial/, definido en C, por el vector 
tangente unitario T{t) = ( dtxjds) En este caso la integral de linea Sc yds coincide 
con esta otraJ c /- da debido a que 

/[«(')] • <*'(0 =/[«(0] • 3 ^ y =/t«(0]' T{t)s\t) = gj[a(r)]s'(r). 
as dt 

Cuando/ representa una velocidad, el producto interior/• Jes el componente 
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tangencial de la velocidad, y la integral de linea jc f‘ T ds es la integral de flujo 
de / a lo largo de C. Cuando C es una curva cerrada la integral de flujo es la 
circulacion de / a lo largo de C. Estas denominaciones se usan corrientemente en 
la teoria del flujo de fluidos. 

10.8 Otras aplicaciones de las integrates de linea 

Las integrales de linea con respecto a la longitud de arco se presentan tambien 
en problemas relativos a la distribution de la masa a lo largo de una curva. Por 
ejemplo, imaginemos una curva C en el espacio de tres dimensiones como un 
delgado alambre de densidad variable. Supongamos que la densidad se expresa 
mediante un campo escalar cp, siendo y{x, y, z) la masa por unidad de longitud 
en el punto (x, y, z) de C. La masa total M del alambre viene entonces definida 
como la integral de linea de cp con respecto a la longitud de arco: 

M = J c (fix, y, z ) ds. 

El centro de gravedad se define como el punto {x, y, z) cuyas coordenadas estan 
determinadas por las ecuaciones 

xM = J c xcf(x, y, z) ds, yM = f c ycp(x, y, z) ds, zM = j z<p(x, y, z) ds . 

Un alambre de densidad constante se llama uniforme. En este caso el centro de 
gravedad tambien se llama centroide. 

ejemplo 1. Calcular la masa M de un muelle que tiene forma de helice 
cuya ecuacion vectorial es 

a(r) = a cos t i + a sen tj + btk 
si la densidad en (x, y, z) es x 2 + y 2 + z 2 . 

Solucion. La integral para calcular M es 

M = [ (x 2 + y 2 + z 2 ) ds = f 2,r (a 2 cos 2 1 + u 2 sen 2 1 + b 2 t 2 )s’{t) dt. 

d C do 

Puesto que s'(t) = ||a'(0ll y a'(t) — — a sen ti + a cos tj + bk, tenemos s'(t) = 
— V a 2 + b 2 y por tanto 

M = v a 2 + b 2 j 2 "(a 2 + b 2 t 2 ) dt = \ a 2 + b 2 {lira 2 + ® n 3 b 2 ^j . 
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En este ejemplo la coordenada z del centro de gravedad viene dada por 

fM = j c z(x 2 + / + z 2 ) ds = Va 2 + b 2 £“ bt(a 2 + b 2 t 2 ) clt 
— b\Ja 2 + b~ (27r 2 a 2 + A^b 2 ). 

La determinacion de las coordenadas X e y, se propone como ejercicio 15 en la 
section 10.9. 

Las integrales de lfnea se pueden utilizar para definir el momento de inercia 
de un alambre o hilo con respecto a un eje. Si 8(x, y, z) representa la distancia 
desde un punto ( x, y, z) de C a un eje L, el momento de inercia II esta defmido 
por la integral de linea 


i l = j c y, z)<p{x, y, z) ds, 

en donde <p(x, y, z) es la densidad en (x, y, z). Los momentos de inercia respecto 
a los ejes coordenados se representan por I x , I y e I z . 

ejemplo 2. Calcular el momento de inercia I z del muelle del ejemplo 1. 

Solution. Aqui S 2 (x, y, z) — x 2 + y 2 — a 2 y cp(x, y, z) = x 2 + y 2 + z 2 , ast 
que tenemos 

1* = j c (x 2 + /X* 2 + y 2 + z 2 ) ds = a 2 J c (x 2 + / + z 2 ) ds = Ma 2 , 

en donde M es la masa, como se calculo en el ejemplo 1. 

10.9 Ejercicios 


1. Un campo de fuerzas / del espacio de tres dimensiones viene dado por/(x, y,z) = 
xi + yj + (xz — y)k . Calcular el trabajo realizado por esa fuerza al mover una 
partfcula desde (0,0,0) a (1,2,4) a lo largo del segmento de recta que une esos puntos. 

2. Hallar el trabajo realizado por la fuerza/(x, y) =(x 2 —y*)i + 2xyj al mover una particula 
en sentido contrario al de las agujas del reloj recorriendo una vez el contorno del 
cuadrado limitado por los ejes coorderjados y las rectas x — a <z, y — a, a> 0. 

3. Un campo de fuerzas bidimensional / viene dado por la ecuacion f(x, y) =cxyi + x e 'y 2 j 
siendo c una constante positiva. Esa fuerza actua sobre una particula que se mueve 
desde (0,0) hasta la recta x = 1 siguiendo una curva de la forma 

y = ax b , en donde a > 0 y b > 0. 
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Encontrar el valor de a (en funcidn de c) tal que el trabajo realizado por esa fuerza sea 
independiente de b. 

4. Un campo de fuerzas / en el espacio de tres dimensiones viene dado por la formula 
f(x,y, z) = yzi 4- xzj + x(y + \)k. Calcular el trabajo realizado por / al mover una 
particula recorriendo una vez el contorno del triangulo de vertices (0,0,0), (1,1,1), 
( —1,1,—1) en este orden. 

5. Calcular el trabajo realizado por el campo de fuerzas /(a:, y, z) = (y — z)i + (z — x)j 
4-(x — y)k a lo largo de la curva de interseccion de la esfera x 1 + y 2 + z 2 = 4 y el 
piano z — y tan 8, en donde 0 < e < sr/2. El camino es recorrido de modo que, obser- 
vado el piano xy desde el eje z positivo, el sentido aparezca contrario al de las agujas 
del reloj. 

6. Calcular el trabajo realizado por el campo de fuerzas f(x,y, z)—y 2 i + z 2 j 4- x 2 ka lo 
largo de la curva de interseccion de la esfera x 2 + y 1 + z 1 = a 2 y el cilindro x ! 4 - y 2 = ax, 
siendo z > 0 y a > 0. El camino es recorrido de modo que, observado el piano xy 
desde el eje z positivo el sentido sea el de las agujas del reloj. 

Calcular la integral de li'nea con respecto a la longitud de arco en cada uno de los ejer- 
cicios del 7 al 10. 

7. J c (x + y ) ds, siendo C el triangulo de vertices (0,0), (1,0) y (0,1), recorrido en sentido 
contrario al de las agujas del reloj. 

8. J c y 2 ds, en donde C tiene la ecuacion vectorial 


a(t) = a(t - sen t)i 4- a(l - cos t)j , 0 < / <2^r. 

9. lr (x 2 -f y 2 ) ds, donde C tiene la ecuacion vectorial 

a(r) = a(cos t + t sen t)i + a(senf — tcos t)j, 0 < t < 2w. 

10. j" (. z ds, donde C tiene la ecuacidn vectorial 

a(t) = t cos / / 4- 1 sen tj + tk, 0 <, t <, t 0 . 


11. Consideremos un alambre semicircular uniforme de radio a. 

a) Demostrar que el centroide esta situado en el eje de simetri'a a una distancia 2 a/'rr 
del centro. 

b) Demostrar que el momento de inercia respecto al diametro que pasa por los extre- 
mos del alambre es l Ma 2 , siendo M la masa del alambre. 

12. Un alambre tiene la forma de un circulo x 2 + y 2 = a 2 . Determinar su masa y su mo¬ 
mento de inercia respecto a un diametro si la densidad en (x, y) es |x| 4 - |y|. 

13. Hallar la masa de un alambre cuya forma es la de la curva de interseccion de la esfera 
x 2 4- y 2 4- z 2 = 1 y el piano x4-y4-z = 0sila densidad del alambre en (x, y, z) es x 2 . 

14. Un alambre uniforme tiene la forma de la porcion de curva de interseccion de las dos 
superficies x 2 4- y J = z 2 e y ! = x que une los puntos (0,0,0) y (1, 1, V2). Hallar la coor- 
denada z del centroide. 

15. Determinar las coordenadas x e y del centro de gravedad del muelle que se cita en el 
ejemplo 1 de la seccion 10.8. 

16. Para el muelle del ejercicio 1 de la seccion 10.8, calcular los momentos de inercia I x e I.. 
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10.10 Conjuntos conexos abiertos. Independence del camino 

Sea S un conjunto abierto de R". El conjunto S se llama conexo si todo par 
de puntos de S puede unirse mediante un camino regular a trozos cuya grafica 
esta situada en S. Esto es, para todo par de puntos a y b de S existe un camino 
regular a trozos a definido en un intervalo [a, b] tal que a(t) e S para cada 
t de [a, b ], siendo a(a) — a y a (b) — b. 

En la ftgura 10.3 se muestran tres ejemplos de conjuntos convexos abiertos. 
Ejemplos analogos a esos en el espacio de tres dimensiones podrian ser a) un 
solido elipsoidal, b) un solido poliedrico, y c) un solido torico; en cada caso solo 
se consideran los puntos interiores. 

Un conjunto abierto S se dice que es no conexo si S es la reunion de dos o 
mas conjuntos abiertos no vacios disjuntos. En la ftgura 10.4 se muestra un ejem- 
plo. Puede demostrarse que la clase de los conjuntos conexos abiertos es identica 
a la de los conjuntos abiertos que son no conexos. (*) 

Sea ahora / un campo vectorial continuo en un conjunto conexo abierto S. 
Elijamos dos puntos a y b de S y consideremos la integral de linea de / a lo largo 
de un camino regular a trozos situado en S que una ay b. El valor de la integral 
depende, en general, del camino que une a y b. Para ciertos campos vectoriales, la 
integral depende unicamente de los extremos a y b y no del camino que los 
une. En este caso decimos que la integral es independiente del camino que une 
a y b. Decimos que la integral de linea de / es independiente del camino en S si 
es independiente del camino que une a y b para todo par de puntos a y b de S. 



(a) (b) (c) 


Figura 10.3 Ejemplos de conjuntos conexos Figura 10.4 Conjunto no conexo S, 
abiertos. reunion de dos discos circulares 

disjuntos. 

cQue campos vectoriales tienen integrales de linea independientes del camino? 
Para contestar esta pregunta, extendemos los teoremas fundamentales primero y 
segundo del calculo a las integrales de linea. 

(*) Para estudiar con mayor profundidad la conexion de conjuntos, vease el capitulo 8 
de la obra del autor Analisis Matemdtico, Editorial Reverte, Barcelona, 
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10.11 Segundo teorema fundamental del calculo para integrates de linea 

El segundo teorema fundamental para funciones reales, como se dernostro en 
el volumen I (teorema 5.3), establece que 

P <p'0)dt = q(b) - 


con tal que q>' sea continua en un cierto intervalo abierto que contenga a y b. 
Para extender ese resultado a las integrales de linea necesitamos una version algo 
mas fuerte del teorema en la que la continuidad de <p' se supone solamente en el 
intervalo abierto (a, b). 

teorema 10.2. Si q es una funcidn real continua en un intervalo cerrado 
[a, fc], si suponemos que la integral j' f ; <p'(t)dt existe y si q' es continua en el 
intervalo abierto ( a , b), entonces tenemos 

P <f '(0 dt = <f{b) - (f{a ). 

Demostracion. Para cada x de [ a , 6 ] definamos fix) = $*q'it) dt. Queremos 
demostrar que 

(10.2) fib) = (f{b) - (f (a). 

Segun el teorema 3.4 del volumen I, / es continua en el intervalo cerrado [a, b]. 
Segun el teorema 5.1 del volumen I, / es derivable en el intervalo abierto ia,b), 
con fix) = q\x) para cada x de (a, b). Por consiguiente, segun el teorema de la 
derivada nula (teorema 5.2 del volumen I), la diferencia / — q> es constante en el 
intervalo abierto (a, b). Por la continuidad, / — q tambien es constante en el in¬ 
tervalo cerrado \a,b]. En particular, f{b) -qib) = fia) - qia). Pero como 
fia)~0 , esto demuestra ( 10 . 2 ). 

TEOREMA 10.3. SEGUNDO TEOREMA FUNDAMENTAL DEL CALCULO PARA INTE¬ 
GRALES de linea. Si q es un campo escalar diferenciable con gradiente continuo 
V q en un conjunto conexo abierto S en R”, entonces para dos puntos cualesquiera 
a y b unidos por un camino regular a trozos a situado en S tenemos 


rb 

) a ^q- da. = qib) - 93 (a). 

Demostracion. Elijamos dos puntos cualesquiera a y b de S y unamoslos con 
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un camino regular a trozos a situado en S definido en un intervalo [a, b], Supon- 
gamos primero que a es regular en [a,b]. Entonces la integral de llnea de Vr; 
entre a y b a lo largo de a viene dada por 

J a Vq, ■ da = £" V<p[a(r)] ' a'(t) dt. 

Segun la regia de la cadena tenemos 

V<p[a(/)]-a'(f) = g'( 0 . 

en donde g es la funcion compuesta definida en [ a, fe] por la formula 


g(t) = tp[<x(t)]. 


La derivada g' es continua en el intervalo abierto (a, b) debido a que es con- 
tinua en S y a es regular. Por lo tanto podemos aplicar el teorema 10.2 a g obte- 
niendo 

J a V9? • da = J a & g'(0 dt = g(b) - g(a) = (f[a(b)] - ?>[a(a)] = <p(b) - <?(a). 

Esto prueba el teorema si a es regular. 

Cuando a es regular a trozos efectuamos una particion del intervalo [a, 6] 
en un numero finito (por ejemplo r) de subintervalos en cada uno de 

los cuales a es regular, y aplicamos el resultado que acabamos de demostrar a 
cada subintervalo. Esto nos dice 

ja = £ jj’f , v< p = 2 M a <A)] - 9^[a(4-i)]} = ?(*) - <?(«)> 

i=l Jt=l 

como querfamos demostrar. 

Como consecuencia del teorema 10.3 vemos que la integral de h'nea de un 
gradiente es independiente del camino en cualquier conjunto S conexo en el que 
el gradiente sea continuo. Para un camino cerrado tenemos b — a, asf que 
<f(b) — <p(a ) — O.Dicho de otro modo, la integral de linea de un gradiente con¬ 
tinuo es cero a lo largo de todo camino cerrado regular a trozos situado en S. 
En la seccion 10.14 demostraremos (en el teorema 10.4) que los gradientes son 
los unicos campos vectoriales continuos con esta propiedad. 
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10.12 Aplicaciones a la Mecanica 

Si un campo vectorial / es el gradiente de un-campo escalar 99, entonces </ se 
llama funcion potencial para /. En el espacio de tres dimensiones, los conjuntos 
de nivel 9? se llaman superficies equipotenciales; en dos dimensiones se llaman 
tineas equipotenciales. (Si <p representa la temperatura, la palabra «equipotencial» 
se reemplaza por «isoterma»; si 9 : representa la presion se emplea la palabra 
«isobara».) 

ejemplo 1. En el espacio tridimensional, pongamos <p(x, y, z) — r n , sien- 
do r = (x 2 + y 2 + z 2 ) w . Para todo entero n tenemos 

V(r n ) = 

donde r = xi -f yj + zk ■ (Vease el ejercicio 8 de la seccion 8.14). Por lo tanto <p 
es un potencial del campo vectorial 


f{x, y, z) = nr n ~ 2 r. 

Las superficies equipotenciales de 99 son esferas concentricas con el centra en el 
origen. 

ejemplo 2. Potencial newtoniano. La ley de la gravitacion de Newton 
establece que la fuerza / que ejerce una partfcula de masa M sobre otra particula 
de masa m es un vector de longitud GmM/r 2 , en donde G es una constante y r es 
la distancia entre las dos partfculas. Situemos el origen en la partfcula de masa M, 
y sea r = xi 4 - yj + zk el vector posicion que une el origen a la partfcula de 
masa m. Entonces r = }|r|| y — r/r es un vector unitario con la misma direccion 
que /, con lo que la ley de Newton toma la forma 

/ = —GmMr~ 3 r. 

Haciendo n =—len el ejemplo 1 vemos que la fuerza de gravitacion / es el 
gradiente del campo escalar dado por 

(p(x,y, z ) = GmMr - 1 . 

Este es el potencial de Newton. 

El trabajo efectuado por la fuerza de gravitacion al mover la partfcula de 
masa m desde (Xj, y,, z x ) a ( x 2 , y 2 , z 2 ) es 


fix 1 , y 1 , Zi) - <p(x 2 , y 2 , z 2 ) = GmM 
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en donde r, = (x 2 + y\ + z'i)' A y r 2 = (xj + y% + 4)' A ■ Si los dos puntos estan 
en la raisma superficie equipotencial entonces = r 2 y no se realiza trabajo 
alguno. 

ejemplo 3. Principio de conservation de la energla mecanica. Sea / un 
campo de fuerzas continuo que tiene un potencial <p en un conjunto conexo abier- 
to S. El teorema 10.3 nos dice que el trabajo efectuado por / al mover una par- 
ticula desde a hasta x siguiendo un camino regular a trozos situado en S es 
tp(x) — <p(a) , la variacion de la funcion potencial. En el ejemplo 2 de la seccion 
10.6 se demostro que este trabajo es tambien igual a la variacion de la energia 
cinetica de la particula, k(x) - k{a) en donde k(x) representa la energia cinetica 
de la particula cuando esta situada en x. Asi pues, tenemos 

k(x) - k{a) = (f(x) - <p{a ), 


o 

(10.3) &(x) - <P(x) = *(«) - 9(«)- 

El escalar — q>(x) se denomina energia potential ( *> de la particula. 

Si a se mantiene fijo y x se hace variar en el conjunto S, la ecuacion (10.3) 
nos dice que la suma de k(x) y — (f ix) es constante. Es decir, si un campo de 
fuerzas es un gradiente, la suma de las energias cinetica y potential de una par¬ 
ticula que se desplaza en dicho campo es constante. En Mecanica esto se llama 
principio de conservacion de la energia (mecanica). Un campo de fuerzas con una 
funcion potencial se llama conservative porque la energia total, cinetica mas po¬ 
tencial, se conserva. En un campo conservative, no se realiza trabajo alguno al 
mover una particula alrededor de una curva cerrada volviendo al punto de par- 
tida. Un campo de fuerzas no sera conservative si existe friccion o viscosidad en 
el sistema, puesto que esas tienden a convertir energia mecanica en energia calo- 
rifica. 

10.13 Ejercicios 

1. Determinar cuales de los siguientes conjuntos abiertos S de R 2 son conexos. Para cada 
conjunto conexo, elegir dos puntos distintos cualesquiera de S y explicar como se 
podrfa encontrar en S una curva regular a trozos que los uniera. 

a ) S = {(x,y) | x 2 +y 2 > 0}. c) S = {(x,y) \ x 2 + y 2 < 1}. 

b) 5 = {(x,j) | x 2 +/ >0}. d) S = {(x,y) | 1 < x 2 +/ < 2}. 

e) S = {(x, y) | x 2 + / > 1 y (x - 3) 2 + y 2 > 1}. 

f) S = {(x,y)[x 2 +/ < 1 o (x-3) 2 +/<!}. 


(*) Algunos autores consideran a —<p como la funcion potencial de / de modo que la 
energia potencial en x sera igual al valor de la funcion potencial <p en x. 
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2. Dado un campo vectorial bidimensional 

fix, y) = P{x,y)i + Q(x, y)j, 

en el que las derivadas parciales dP/dy y dQ/dx son continuas en un conjunto abierto 
S. Si / es el gradiente de un cierto potencial <p, demostrar que 

dP _ dQ 
dy dx 


en cada punto de S. 

3. En cada uno de los siguientes campos vectoriales, aplicar el resultado del ejercicio 2 
para demostrar que / no es un gradiente. Hallar seguidamente un camino cerrado C tal 
que \ c f 0. 

a ) fix, y) =yi - xj. 

b) fix, y) = yi 4- (xy - x)j. 

4. Dado un campo vectorial tridimensional 

f(x,y, z) = P(x,y, z)i + Q(x,y, z)j + R(x,y, z)k, 

en el que las derivadas parciales 

dP dP dQ 5 Q dR dR 

dy dz ' dx dz ’ dx ’ dy ’ 

son continuas en un conjunto abierto S. Si / es el gradiente de una cierta funcion po¬ 
tencial (f, demostrar que 

dP dQ dP dR dQ dR 

dy dx ’ dz dx ’ dz dy 


en cada punto de S. 

5. En cada uno de los siguientes campos vectoriales, aplicar el resultado del ejercicio 4 
para demostrar que / no es un gradiente. Hallar seguidamente un camino cerrado C 
tal que j c /VO. 

a) fix, y, z) = yi + xj + xk . 

bj fix, v, z) = xyi + (x 2 4- 1 )j 4- z 2 k. 

6. Un campo de fuerzas / esta definido en el espacio de tres dimensiones por la ecuacion 

fix, y, z) = yi 4- zj 4- yzk . 

a) Determinar si / es o no conservative. 

b) Calcular el trabajo realizado al mover una parti'cula a lo largo de la curva de 
ecuacion 


a {t) = cos t i + sen tj + e i k 


cuando t vart'a de 0 a v. 
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7. Un campo de fuerzas bidimensional F tiene por ecuacion 

Fix, y) = (x + y)i + (x - y)j. 

a) Demostrar que el trabajo realizado por esa fuerza al mover una particula siguiendo 
la curva 


“(0 = fit)i + g{t)j, a < t < b, 
depende unicamente de /(a), fib), g(a), g(b). 

b) Hallar el trabajo realizado cuando fia) = 1, fib) = 2, gia) — 3, gib) = 4. 

8. Un campo de fuerzas viene dado en coordenadas polares por la ecuacion 


F(r,0) = —4 sen 0 i + 4 sen 0 j. 

Calcular el trabajo efectuado al mover una particula desde el punto (1,0) al origen si¬ 
guiendo la espiral cuya ecuacidn polar es r = e «. 

9. Un campo de fuerzas radial o «central» F en el piano puede expresarse en la forma 
F{x,y) = fir)r en donde r = xi + yj y r — |jii| . Demostrar que un tal campo de fuer¬ 
zas es conservative. 

10. Hallar el trabajo realizado por la fuerza Fix,y) — (3 y 2 + 2)i + 16 xj al mover una par- 
tfcula desde ( — 1,0) a (1,0) siguiendo la mitad superior de la elipse b 2 x 2 + y 1 — b\ 
tQue elipse (es decir, que valor de b) hace mi'nimo el trabajo? 


10.14 El primer teorema fundamental del calculo para integrales de linea 

En la seccion 10.11 se extendio el segundo teorema fundamental del calculo 
a las integrales de linea. En esta seccion se extiende el primer teorema fundamen¬ 
tal. Recordemos que este establece que toda integral indefinida de una funcion 
continua / tiene una derivada igual a /. Esto es, si 


(fix) = \ a fit ) dt, 

en los puntos de continuidad de / tenemos 

(fix) = fix). 


Para extender este teorema a las integrales de linea comenzamos con un cam¬ 
po vectorial /, continuo en un conjunto conexo abierto S, y lo integramos a lo 
largo de una curva regular a trozos C entre un punto fijo a de S a un punto 
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cualquiera x. Designemos entonces con y el campo escalar definido por la inte¬ 
gral de li'nea 


f f(x) = !*/• da. 


en donde a es la funcion que origina C. Puesto que S es conexo, cada punto x de 
S puede ser alcanzado por una tal curva. Para que esta definition de (fix) carezca 
de ambigiiedad, necesitamos saber que la integral depende unicamente de r y 
no del camino utilizado para unir a con x. Por consiguiente, es natural exigir que 
la integral de li'nea de / sea independiente del camino en S. En esas condiciones 
la extension del primer teorema fundamental toma la forma siguiente: 

TEOREMA 10.4. PRIMER TEOREMA FUNDAMENTAL PARA INTEGRATES DE 
li'nea. Sea f un campo vectorial continuo en un conjunto conexo abierto S de 
R", y supongamos que la integral de linea de f es independiente del camino en S. 
Sea a un punto fijo de S y definamos un campo escalar (f en S mediante la ecuacion 

r f(x) = J a f-da, 

en donde a es un camino regular a trozos de S que une a con x. Existe entonces 
el gradiente de cp y es igual a f; es decir 

V<^(x) = fix) para todo x de S. 

Demostracion. Demostraremos que la derivada parcial D ,/fix) existe y es 
igual a f k (x), componente &-esima de f(x), para cada k = 1, 2,. . ., n y cada 
x de S. 

Sea B(x; r) una n-esfera con centra en x y radio r contenida en S. Si y es 
un vector unitario, el punto x + hy tambien esta contenido en S para todo h real 
que satisfaga la condition 0 < \h\ < r, y podemos formar el cociente de dife- 
rencias 

(fix + hy) - q(x) 
h 

En virtud de la propiedad aditiva de las integrales de li'nea, el numerador de ese 
cociente puede escribirse en la forma 

(fix + hy) - (f(x) == \ X x ' iy f- da, 


y el camino que une x con x + hy puede ser cualquier camino regular a trozos 
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contenido en S. En particular, podemos emplear el segmento de recta represen- 
tado por 


<x(r) = x + thy , en donde 0 < t < 1. 

Puesto que a'(0 — hy el cociente de diferencias toma la forma 

ao.4, i W _ f‘ /(I + , w . yd ,. 

h Jo 

Tomemos ahora y = e k , el fc-esimo vector coordenado unidad, y observemos que 
el integrando se transforma en f(x + thy) ■ y = f k (x 4- the k ). Hagamos luego el 
cambio de variable u = ht, du = hdt, y escribamos (10.4) en la forma 


(10.5) 


(fix + he k ) - <f{x) 
h 


1 

h . 


fk(x + ue k ) du 


0 


g(h) - g( 0 ) 


en donde g es la funcion definida en un intervalo abierto (— r, r) por la ecuacion 


g (0 = \jx(x + ue k ) du . 

Como cada componente fk es continua en S, el primer teorema fundamental para 
integrales ordinarias nos dice que existe g'(t) para cada t en { — r, r) y que 

g’( 0 =fdx + te k ). 

En particular, g'(0) = f k (x). Por consiguiente, si en (10.5) hacemos que h-* 0, 
encontramos que 


.. q(x + he k ) — (f(x) g(/j) — g( 0 ) 

lim- = lim--- 

o h h —o h 


g'( 0 ) =Mx). 


Esto demuestra que la derivada parcial D k q ix) existe y es igual a f k ix), como que- 
riamos demostrar. 

10.15 Condiciones necesarias y suficientes para que un campo vectorial sea un 
gradiente 

Los teoremas fundamentales primero y segundo para integrales de linea nos 
dicen que una condicion necesaria y suficiente para que un campo vectorial sea 
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un gradients en un conjunto conexo abierto es que su integral de linea entre dos 
puntos cualesquiera sea indepcndientc del camino. Demostraremos ahora que esa 
condicion equivale a afirmar que la integral de linea, a lo largo de cualquier 
camino cerrado regular a trozos, es nula. Todas esas condiciones estan resumidas 
en el siguiente teorema. 

TEOREMA 10.5. CONDICIONES NECESARIAS Y SUFICIENTES PARA QUE UN CAM- 
po vectorial sea un gradiente. Si f es un campo vectorial contimio en un 
conjunto conexo abierto S de R", entonces son equivalentes las tres afirmaciones 
siguientes : 

a) f es gradiente de una cierta funcion potencial en S. 

b) La integral de linea de f es independiente del camino en S. 

c) La integral de linea de f alrededor de todo camino cerrado regular a tro¬ 
zos contenido en S es nula. 

Demostracion. Demostraremos que b) implica a), a) implica c), y c) im- 
plica b). La afirmacion b) implica a) en virtud del primer teorema fundamental. 
El segundo teorema fundamental pone de manifesto que a) implica c). 

Para completar la demostracion probemos que c) implica b). Supongamos 
que se cumple c) y sean C, y C, dos curvas regulares a trozos cualesquiera en S 
con los mismos extremos. Sea la curva C, la grafica de una funcion a definida 
en un intervalo [a, b], y C, la grafica una funcion 0 definida en [c, d], 

Definamos una nueva funcion y del modo siguiente: 

, , («(0 si a<t<b, 

Y (0 = " 

10 (* + d-t) si b <t <b + d- c. 

Entonces y describe una curva cerrada C tal que 

j c f-dy= J c /•</<*- J c ./-dp. 

Puesto que en virtud de c) § c f ■ dy = 0, tenemos J' Ci /- da. = j c . /• d$ , por lo 
que la integral de / es independiente del camino. Esto demuestra b). Asi pues, 
a), b) y c) son equivalentes. 


Observacion: Si j ( , / ^ 0 para una determinada curva cerrada C, entonces 
fno es un gradiente. No obstante, si una integral de linea f es cero para una 
cierta curva cerrada C o incluso para infinitas curvas cerradas, no se deduce nece- 
sariamente que f es un gradiente. Por ejemplo, el lector puede comprobar facilmente 
que la integral de linea, del campo vectorial f(x,y) = xi + xyj es cero para todo 
circulo con centro en el origen. No obstante, este campo vectorial no es un gradiente. 



Condiciones para que un campo vectorial sea un grudienie 415 

10.16 Condiciones necesarias para que un campo vectorial sea un gradiente 

El primer teorema fundamental puede utilizarse para determinar si un campo 
vectorial dado es o no un gradiente en un conjunto conexo abierto S. Si la inte¬ 
gral de lfnea de / es independiente del camino en S, definimos sencillamente un 
campo escalar >p integrando / desde un punto fijo a un punto x cualquiera de S 
siguiendo un camino adecuado en S. Calculamos entonces las derivadas parcia- 
les de (p y comparamos D k <p con fk, /c-esimo componente de /. Si D k <p{x) =j k (x) 
para todo x de S y todo k, entonces / es un gradiente en S y </ es un potencial. 
Si D k (f (x) 7 * f k (x) para algun k y un cierto x, entonces / no es un gradiente en S. 

El teorema siguiente da otro criterio para determinar cuando un campo vec¬ 
torial / no es un gradiente. Este criterio es muy util en la practica porque no exige 
integration alguna. 

TEOREMA 10.6. CONDICIONES NECESARIAS PARA QUE UN CAMPO VECTORIAL 
sea un gradiente. Si f = (/i, .. ., /«) es un campo vectorial diferenciable con 
continuidad en un conjunto abierto S de R", y si f es un gradiente en S, entonces 
las derivadas parciales de los componentes de f estan ligados por las ecuaciones 

(10.6) D,f,(x) = DJi(x) 

para i, j = 1, 2.n y todo x de S. 

Demostracidn. Si / es un gradiente, /= V<p para una cierta funcion po¬ 
tencial < p. Esto significa que 


ft = D i<P 

para cada j = 1,2Derivando ambos miembros de esta igualdad respecto 
a Xi encontramos 


Difj = DiDftp. 

Del mismo modo, tenemos 

DJi = DjDiCp . 

Puesto que las derivadas parciales Difj y Djfi son continuas en S, las dos deriva¬ 
das parciales mixtas DiDj(py DjDi<p deben ser iguales en S. Esto demuestra (10.6). 

ejemplo 1. Determinar si el campo vectorial 

f{x, y) = 3 x 2 yi + x 3 yj 


es o no un gradiente en algun subconjunto abierto de R 2 . 
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Solucion. Tenemos aqui 

fi(x, y) = 3 x 2 y, f 2 (x, y) = x 3 y. 

Las derivadas parciales D.J^ y D x / 2 vienen dadas por 

Difiix, y) = 3x 2 , D,/ 2 (x, y) = 3x 2 y. 


Puesto que D 2 f 1 {x, y ) # D,/ 2 (x, y ) excepto cuando x = 0 o y = 1, este campo 
vectorial no es un gradiente en ningun subconjunto abierto de R 2 . 

El ejemplo que sigue pone de manifiesto que las condiciones del teorema 
10.6 no siempre son suficientes para que un campo vectorial sea un gradiente. 

ejemplo 2. Sea S el conjunto de todos los puntos (x, y) # (0, 0) en R 2 , y 
sea/el campo vectorial definido en S por la ecuacion 


fix, y ) 


-y , , x . 

x 2 q - y 2, x 3 -}- y 2 ^ 


Demostrar que D/s = D/j en todo el conjunto S pero que, sin embargo, / no 
es un gradiente en S. 

Solucion. Es facil comprobar que D 1 f 2 (x, y) = D 2 f r (x, y) para todo punto 
(x, y) de S. (Vease ejercicio 17 de la seccion 10.18.) 

Para demostrar que / no es un gradiente en S calculamos la integral de lfnea 
de / a lo largo de la circunferencia unidad dada por 


a(t) = cos ti + sen//, 

Obtenemos 

j f- da = J o /[a(t)j • a'(0 dt = J o (sen 2 1 + cos 2 1 ) dt == 2ir. 

Puesto que la integral de lmea a lo largo de ese camino cerrado no es cero, / no 
es un gradiente en S. En el ejercicio 18 de la seccidn 10.18 se discuten otras pro- 
piedades de ese campo vectorial. 

A1 final de este capltulo demostraremos que las condiciones necesarias del 
teorema 10.6 son tambien suficientes si se cumplen en un conjunto convexo 
abierto. (Vease el teorema 10.9.) 
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10.17 Metodos especiales para construir funciones potenciales 

El primer teorema fundamental para las integrales de linea nos propor- 
ciona tambien un metodo para construir funciones potenciales. Si / es un gra- 
diente continuo en un conjunto conexo abierto S, la integral de linea de / es 
independiente del camino en S. Por lo tanto podemos encontrar un potencial en 
S. Por lo tanto podemos encontrar un potencial cp integrando / desde un punto 
fijo a hasta un punto cualquiera x de S, siguiendo un camino regular a trozos 
situado en S. El campo escalar que asi se obtiene depende de la eleccion del punto 
inicial a. Si empezamos en otro punto inicial b, obtenemos un nuevo potencial 
Pero, en virtud de la propiedad aditiva de las integrales de linea, cp y <p pueden 
diferir unicamente en una constante, siendo esta la integral de / entre a y b. 

Los ejemplos que siguen ilustran el empleo de distintos caminos de inte- 
gracion. 



Figura 10.5 Dos caminos poligonales que unen (a, b) con (x, y). 

ejemplo 1. Construccion de un potencial en un rectangulo abierto. Si / es 
un gradiente continuo en un rectangulo abierto de R'\ puede construirse un po¬ 
tencial integrando entre un punto fijo y un punto arbitrario siguiendo un camino 
formado por segmentos rectilineos paralelos a los ejes coordenados. En la figura 
10.5, se representa un ejemplo en dos dimensiones. Podemos integrar primero 
desde (a, b ) hasta (x, b) a lo largo de un segmento horizontal y luego desde (x, b) 
hasta (x, y) siguiendo un segmento vertical. A lo largo del segmento horizontal 
empleamos la representacion parametrica 


a (0 = ti + bj, 


a < t < x, 
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y a lo largo del vertical empleamos esta otra 

a (t) = xi + tj, b<t<y. 

Si f(x,y) = fi(x,y)i + f 2 (x, y)j , la formula que resulta para un potencial 
<fix, y) es 


( 1 °- 7) V(x, y ) = jj.it, b) dt + J* f 2 ( x , t ) dt. 

Podnamos asimismo integrar primero desde (a, b) hasta ( a, y) siguiendo un 
segmento vertical y luego desde (a, y) hasta (x, y) a lo largo de un segmento ho¬ 
rizontal como se indica con rectas punteadas en la figura 10.5. Esto nos da otra 
formula para (p{x, y), 

( 1 °- 8 ) <f(x, y) = /" f 2 (a, 0 dt + f’fat, y) dt. 

Ambas fdrmulas (10.7) y (10.8) nos dan el mismo valor para <p(x, y) debido 
a que la integral de lfnea de un gradiente es independiente del camino. 

ejemplo 2. Construccion de una funcion potencial utilizando integrates 
mdejimdas. El uso de integrates indefinidas nos simplifican a menudo el calculo 
de iunciones potenciales. Por ejemplo, supongamos que un campo vectorial tri¬ 
dimensional f = (f 1 , f 2 , / 3 ) es el gradiente de una funcion potencial w en un con- 
junto abierto S de R 3 . Tenemos entonces 


drp_ dcp 

dx h ' dy 


f 

dz h 


en todo el conjunto S. Empleando integrales indefinidas e integrando la primera 
de esas ecuaciones respecto a x (manteniendo z e y constantes) encontramos 


(fix, y,z)= J ffx, y, z) dx + A(y, z), 

en donde A(y, z) es una «constante de integracion» que hay que determinar. Ana- 
logamente, si integramos la ecuacion dcp/dz = f 3 respecto a y y a la ecuacion 
d<t jdy — /, respecto a z obtenemos las relaciones 


<p(x, y, z) = J f 2 (x, y, z) dy + B(x, z) 
<p{x, y, z) = j fix, y, Z ) dz -f C(x, y), 
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en las que B(x, z) y C(x, y) son funciones que tienen que determinarse. Encon- 
trar 9 ? significa encontrar tres funciones A(y, z), B(x, z), y C(x, y) tales que las 
tres ecuaciones obtenidas para <p(x, y, z) tengan sus segundos miembros coinci- 
dente. En muchos casos eso puede conseguirse a simple vista, como el siguiente 
ejemplo muestra. 

ejemplo 3. Encontrar una funcion potencial >p para el campo vectorial 
definido en R 3 por la ecuacion 

f(x,y, z ) = ( 2 xyz + z 2 — 2 y 2 + l)i + (x 2 z — 4 xy)j + (x 2 y + 2xz — 2)k. 

Solution. Sin conocer de antemano si / tiene o no funcion potencial 99, in- 
tentamos construir un potencial como se indico en el ejercicio 2 , suponiendo que 
tal potencial cp exista. 

Integrando el componente f x respecto a x encontramos 

<p(x, y, z) = j (2 xyz + z 2 - 2/ + 1) dx + A(y, z) = x 2 yz + xz 2 

— 2 xy 2 + x + A(y, z). 

Integrando / 2 respecto a y, y luego f 3 respecto a z, encontramos 


<p(x, y,z) — J (x 2 z — 4 xy) dy + B(x, z) = x 2 yz — 2 xy 2 + B(x, z), 

<p(x, y,z) — J (x 2 y + 2xz — 2) dz + C(x, y) = x 2 yz + xz 2 — 2z + C(x, y). 

facilmente se ve que eligiendo A(y, z) = — 2z, B(x, z) = xz 2 + x — 2z y 
C(x, y) = x — 2xy 2 coinciden las tres ecuaciones; luego la funcion cp dada por la 
ecuacion 


<p(x, y, z) = x 2 yz + xz 2 — 2xy 2 + x — 2z 


es un potencial para / en R\ 

ejemplo 4. Construction de un potential en un conjunto convexo. Un 
conjunto S de R” se llama convexo si todo par de puntos de S puede unirse con 
un segmento rectilineo, cuyos puntos pertenecen todos a S. En la figura 10.6 se 
representa un ejemplo. Todo conjunto convexo abierto es conexo. 

Si / es un gradiente en un conjunto convexo abierto, puede entonces cons- 
truirse un potencial 99 integrando / entre un punto fijo a de S hasta un punto 
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cualquiera * siguiendo un segmento de recta que los una. Tal segmento puede 
representarse parametricamente por la funcion 

a(t) = a + t(x — a) , en donde 0 < t < 1 . 

fista nos da <*'(/) = x — a, as! que el potencial correspondiente viene dado por 
la integral 

(10.9) (fix) = £/(« + Kx - a)) ■ (x — a) dt. 




No convexo 


Figura 10.6 En un conjunto convexo S, el segmento que une a con b esta contenido en S 

cualesquiera que sean a y b de S. 

Si S contiene el origen podemos considerar a = O y escribir (10.9) en la 
forma mas sencilla 


( 10 . 10 ) 


( P( X ) = J o V(tx) -xdt. 


10.18 Ejercicios 

En cada uno de los ejercicios del 1 al 12, esta definido un campo vectorial f por las 
fdrmulas que se dan. En cada caso determinar si ft s o no el gradiente de un campo escalar. 
Cuando / sea un gradiente, hallar la correspondiente funcion potencial <p. 

1. f(x,y) = xi +yj. 

2. fix, y) = 3x 1 2 yi + jc 3 4 5 6 7 /. 

3. f{x,y) = (2xe y + y)i + (x 2 e y + x - 2,y)j. 

4. f{x,y) = (sen y - y sen x + x)i + (cos x + x cos y + y)j. 

5. fix, y) = [sen(xj’) + xy cos Oty)]/ + x 2 cos (xy)j. 

6. fix, y, z) = xi + yj + zk. 

7. fix, y, z) = ix + z)i - iy + z)j + (x - y)k. 


Ejercicios 
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8. fix, y, z) = 2 xfi + x 2 z 3 j + 3x 2 yz 2 k , 

9. f(x, y, z) = 3y l z 2 i + 4A 2 ; - 3x 2 j 2 /c. 

10. fix, y, z) = (2jc 2 + 8x/)/ + (3x 3 j - 3 xy)j - (4/z 2 + 2x 3 z)k. 

11. fix, y, z) — iy 2 cos x + z 3 )i — (4 — 2 y sen x)j + (3 xz 2 + 2 )k. 

12. fix, y, z) = i4xy - 3xV + 1)/ + 2(x 2 + 1 )j - (2 x 3 z + 3z 2 )k. 


13. Un fluido se desplaza en el piano xy de mcdo que cada parti'cula se mueve en h'nea 
recta desde el origen. Si una parti'cula esta a la distancia r del origen su velocidad es 
ar ", en donde a y n son constantes. 

a) Determinar los valores de a y n para los cuales el catnpo vectorial velocidad es el 
gradiente de un cierto campo escalar. 

b) Encontrar una funcion potencial de la velocidad siempre que esta sea un gra¬ 
diente. El caso n = — 1 debe tratarse separadamente. 

14. Si <p y son funciones potenciales para un campo vectorial continuo f en un conjunto 
conexo abierto S de R”, demostrar que <p — ^ es constante en S. 

15. Sea S el conjunto de todos los puntos x ^ O de R\ Pongamos r = ||x|| y sea / el campo 
vectorial definido en S por la ecuacion 

fix) = r p x, 

siendo p una constante real. Hallar una funcion potencial para / en S. El caso p = —2 
debe tratarse separadamente. 

16. Resolver el ejercicio 15 para el campo vectorial definido por la ecuacion 



siendo g una funcion real con derivada continua en todo R*. 


Los ejercicios que siguen se refieren al campo vectorial f definido en el conjunto S de 
todos los puntos ix, y) =* (0,0) en R 2 por la ecuacion 


fix,y) = - 


y 


; i + 


a: 2 + y l x 2 + y 2 


En el ejemplo 2 de la seccion 10.6 se demostro que / no es un gradiente en S, aunque 
D,/j = Dih en todo S. 


17. Comprobar que para todo punto ix, y) de S tenemos 

y 2 — X'^ 

DJ 2 ix,y) = D^ix^) = — + y2j2 

18. Este ejercicio muestra que / es un gradiente en el conjunto 

T =R 2 -{(a:,j)|^ =0, a: ^ 0}, 
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que c °n sta de todos los puntos del piano xy excepto los del eje x no positivo. 
a) Si ( x, y)e T, expresar xe yen coordenadas polares 

* = rcos 0, y = /-sen 0, 

en donde r> 0 y -w < B < ir. Demostrar que B viene dada por las formulas 


y 

arctan - 
x 


e = ( - 


arctan - 4- n 
x 


si x > 0, 
si x = 0, 
si x < 0. 


[Recuerdese la deiinicion de la funcion arco tangente: Para cualquier valor real t, 
arc tan t es el numero real unico que satisface las dos condiciones tan w — t v 
-ir/2 < <p < 7r/2.] 
b) Deducir que 


30 y 00 x 

dx x 2 + y 2 ’ dy x 2 + y 2 

para todo (x, y) en T. Esto demuestra que 6 es una funci6n potencial para f en el 
conjunto T. 

Este ejercicio hace ver que la existencia de una funcion potencial depende no solo 
del campo vectorial / sino tambien del conjunto en el que esta definido el campo 
vectorial. 


10.19 Aplicaciones a las ecuaciones diferenciales exactas de primer orden 

Algunas ecuaciones diferenciales de primer orden pueden resolverse por me¬ 
dio de funciones potencial. Supongamos que tenemos una ecuacion diferencial 
de la forma 


/ =f(x,y). 

Si multiplicamos ambos miembros por un factor no nulo Q(x, y) transformamos 
esta ecuacion en otra de la forma Q(x, y )/ - f(x, y)Q(x,y) = 0. Si ponemos 
P(x, y) en lugar de - f(x,y)Q(x, y) y empleamos la notacion de Leibnitz para las 
derivadas, escribiendo y en la forma dy I dx, la ecuacion diferencial adopta la 
forma 


( 10 . 11 ) 


P(x, y) dx + Q(x, y) dy = 0 . 
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Supongamos que P y Q son continuas en un cierto conjunto abierto conexo S del 
piano. A una tal ecuacion diferencial podemos asociar un campo vectorial V, donde 

V(x,y) = P(x,y)i + Q(x,y)j. 

Los componentes P y Q son los coeficientes de dx y dy en la ecuacion (10.11). 
Se dice que la ecuacion (10.11) es exacta en S si el campo vectorial V es el gra- 
diente de un potencial; esto es, si V(x,y) = V<p(x,y) para cada punto (x, y) de S; 
siendo cp un cierto campo escalar. Cuando un tal cp existe tenemos d<pldx = P y 
dcpjdy = Q, y la ecuacion diferencial (10.11) se transforma en 


%dx + &dy = 0. 
dx dy 


Demostraremos ahora que cada solucidn de esta ecuacion diferencial satisface la 
relacion <p(x, y) = C, siendo C una constante. Precisando mas, supongamos que 
existe una solucion Y de la ecuacion diferencial (10.11) definida en un intervalo 
abierto (a, b) tal que el punto (x, Y(x)) esta en S para cada x de (a, b ). Demos¬ 
traremos que 


<p[x, F(x)] = C 

para una cierta constante C. A tal fin introducimos la funcion compuesta g defi¬ 
nida en (a, b) por la ecuacion 


g(x) = y[x, Y(x)]. 

Segtin la regia de la cadena, la derivada de g viene dada por 

(10.12) g'(x) = DMx, TO] + D 2 <p[x, F(x)]7'(*) = P{x,y) + Q(x,y)y', 

donde y = 7(x) e/ = Y'(x). Si y satisface (10.11), P{x, y) + Q(x, y)y' = 0, de 
modo que g'(x) = 0 para cada x en (a, b ) y, por consiguiente, g es constante en 
(a, b). Esto prueba que toda solucion y satisface la ecuacion <j?(x, y) = C. 

Podemos ahora invertir el razonamiento para hallar una solucion de la ecua¬ 
cion diferencial. Sea la ecuacion 

(10.13) <f{x,y) = C 

consideremos y como funcion diferenciable de x, tal como y = Y(x) para valores de 
x de un intervalo (a, b), y sea g{x)=cp\_x, y(x)]. La ecuacion (10.13) implica que g 



424 


Integrates de linea 


es constante en (a, b).Luego, segun (10.12), P(x, y) + Q(x, y)y' = 0,de modo que 
y es una solution. Por consiguiente, hemos demostrado el teorema siguiente: 

teorema 10.7. Supongamos que la ecuacion diferencial 


(10.14) P(x,y) dx + Q{x,y) dy = 0 

es exacta en un conjunto conexo abierto S, y sea <p un campo escalar que satisface 


d<p 

dx 


P 


y 



en todo S. Entonces toda solucion y = Y{x) de (10.14) cuya grafica esta situa- 
da en S satisface la ecuacion rp[x, Y(x)] = C para un cierto valor de C. Recipro- 
camente, si la ecuacion 


<p(*,y ) = c 

define y como funcion implicita diferenciable de x, entonces esta funcion es una 
solucion de la ecuacion diferencial (10.14). 

El teorema precedente nos proporciona un metodo rapido para resolver ecua- 
ciones diferenciales exactas de primer orden. Construimos una funcion poten¬ 
tial <p y escribimos la ecuacion <p(x, y) = C, siendo C una constante. Siempre 
que esta ecuacion defina y como funcion implicita de x, la correspondiente y 
satisface (10.14). Por tanto, podemos considerar la ecuacion (10.13) como la 
representation de una familia de curvas integrales simplemente infinita, o sea, 
dependiente de un solo parametro. Naturalmente, que los unicos valores admi- 
sibles de C son aquellos para los que cp(x 0 , y 0 ) = C para algun (x 0 , y 0 ) de S. 

EfEMPLO 1. Consideremos la ecuacion diferencial 


dy _ _ 3x 2 + 6 xy 2 
dx 6 x 2 y + 4y 3 

Quitando denominadores se obtiene: 

(3x 2 + 6xy 2 ) dx + (6x 2 y + 4y 3 ) dy == 0. 


Este es ahora un caso particular de (10.14) siendo P(x, y) = 3* 2 + 6xy 2 y 
0(x, y) = 6* 2 y + 4/. Integrando P con respecto a i y Q con respecto a y y 
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comparando los resultados, encontramos que una funcion potencial y viene dada 
por la formula 


<p{x, y) = x 3 + 3 x 2 y 2 + y 4 . 

Segun el teorema 10.7, cada solucion diferencial satisface 

x 3 + 3x 2 y 2 + y 4 = C 

para un cierto C. Esto representa en forma implicita una familia de curvas inte- 
grales. En este caso particular la ecuacion es cuadratica en y 2 y puede despejarse 
y en funcion de x y de C. 

ejemplo 2. Sea la ecuacion diferencial de primer orden 

(10.15) . ydx + Ixdy = 0. 

En este ejemplo P(x, y) = y y Q(x, y) = 2x. Puesto que dP/dy = 1 y dQ/dx = 2, 
esta ecuacion diferencial no es exacta. Sin embargo, si multiplicamos ambos miem- 
bros por y obtenemos una ecuacion que es exacta: 

(10.16) y 2 dx + Ixydy = 0 . 

Un potencial del campo vectorial y 2 i + 2 xyj es q(x, y) = xy 2 , y toda solucion 
de (10.16) satisface la relacion xy 2 = C. Esta relacion tambien representa una 
familia de curvas integrales de la ecuacion (10.15). 

El multiplicador y que ha convertido (10.15) en una ecuacion exacta se 
llama factor integrante. En general, si al multiplicar una ecuacion lineal de primer 
orden por un factor no nulo /u{x, y) se obtiene una ecuacion diferencial exacta, 
el multiplicador /x{x, y) se denomina factor integrante de la ecuacion origi¬ 
nal. Una ecuacion diferencial puede tener mas de un factor integrante. Por 
ejemplo, /i(x, y) = 2xy 3 es otro factor integrante de (10.15). En los ejercicios que 
siguen se discuten algunos casos particulares de ecuaciones diferenciales para las 
que se pueden encontrar facilmente factores integrantes. 

10.20 Ejercicios 

Demostrar que las ecuaciones diferenciales de los ejercicios del 1 al 5 son exactas, y en 
cada caso hallar una familia simplemente infmita de curvas integrales. 

1.0+ 2 y) dx + (2x + y)dy = 0. 

2. 2xy dx + x 2 dy — 0. 

3. O 2 — y)dx — O +sen 2 y)ay = 0. 
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4. 4 sen .v sen 3 v cos .v tlx — 3 cos 3y cos 2x dy = 0. 

5. (3.v-r + 8 x\~)dx 4- (a* + 8a- 2 )' + 12 [ye’ 1 ) dy = 0. 

6. Demostrar que una ecuacion lineal de primer orden y’ 4- PMy = QM, posee el factor 
integrante nM = t >f/’■<>)*. Resolver con el la ecuacion. 

7. Sea fi(x, y) un factor integrante de la ecuacion diferencial P(x, y) dx + Q(x, y) dy = 0. 
Demostrar que 

dP dQ d 3 

^-T x =Q Tx^ M - p Ty l0 ^i iU 

Deducir de esta ecuacion las siguientes reglas para encontrar factores integrantes: 

a) Si ( dP/dy — 3Q/dx)/Q es un funcion jM de la sola variable x, e !Pxiar es un 
factor integrante. 

b) Si (BQjdx — 3Pj3y)\P t s una funcion g(y) de la sola variable y, e laiy)da es un 
factor integrante. 

8. Como aplicacion del ejercicio 7 hallar factores integrantes, y hallar las familias de 
curvas integrales para las ecuaciones siguientes: 

a) y dx - (2.v + y) dy =0. 

b) (.v 3 4-_f*)r/.v — xy 2 dy = 0. 

9. Si SP! dy - 3Qj dx = f(x)Q(x, y) - g(y)P(x, y), demostrar que {f fix) dx + J g(y) dy} 
es un factor integrante de la ecuacion diferencial P(x, y) dx + Q(x, y) dy = 0. Hallar el 
correspondiente factor integrante para cada una de las ecuaciones siguientes y su fami- 
lia simplemente infinita de curvas integrales: 

a) (2,v 2 )' + y 2 ) dx 4- (2a 3 — xy) dy — 0 . 

b) ( e J sec y — tan y) dx 4 - dy — 0. 

10. Las siguientes ecuaciones diferenciales tienen un factor integrante comun. Hallarlo y 
determinar la familia de curvas integrales para cada ecuacion. 


(3y 4- 4 av 2 ) dx + (4a 4- 5a 2 )') dy = 0, 
(6y 4- a 2 )’ 2 ) dx 4- (8a 4- A 3 _y) dy = 0. 


10.21 Funciones de potencial en conjuntos convexos 

En el teorema 10.6 se demostro que las condiciones 

A/A) = A/A) 

son necesarias para que un campo vectorial diferenciable con continuidad 
/= (.A...,/) sea un gradiente en un conjunto S de R". Se demostro luego, 
con un ejemplo, que esas condiciones no eran siempre suficientes. Demostramos 
en esta seccion que las condiciones son suficientes siempre que S sea convexo. 
La demostracion hara uso del siguiente teorema relativo a la derivacion bajo el 
signo integral. 
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teorema 10.8. Sea S un intervalo cerrado en R" con interior no vacio y 
sea J = [a, b] un intervalo cerrado en R 1 . Sea /„+, el intervalo cerrado S X / 
de R" fl . Cada punto de /„ +1 lo representamos por(x, t), en donde x e S y t eJ, 

(*> 0 = (Xj,. . . , x n ,.t). 

3 

Supongamos que d es un campo escalar definido en J n+1 tal que la derivada par¬ 
tial Dksea continua en /„+„ siendo k unc de los numeros 1,2,... ,n. Defina- 
mos un campo escalar <p en S por la ecuacion 

<p(x) = f 6 xp(x, t) dt. 

da 

Existe entonces la derivada partial Dt,q> en cada punto interior de S y se obtiene 
con la formula 


D k q(x)= P D k y(x, t) dt . 

d a 

Es decir, tenemos 


D k j b fix, 0 dt = P 

da d a 


D k yj(x, t) dt. 


Observation. Este teorema nos indica que podemos derivar bajo el signo integral. 

Demostracidn. Elijamos un x cualquiera en el interior de S. Puesto que 
int S es abierto, existe un r > 0 tal que x + he k e int S para todo h que satisfaga 
0 < h < r El vector e k es el fc-esimo vector coordenado unidad de R\ Para 
tal h tenemos 

(10.17) <f(x + he k ) - (f(x) = j a {y(x + he k , t ) — ip(x, t )} dt. 

Aplicando el teorema del valor medio al integrando tenemos 
ip{x + he k , t) - y(x, t) = h D k y{z, t ), 

en donde z pertenece al segmento rectilineo que une x con x + he k . Luego (10.17) 
se transforma en 


cpjx + he k ) - cp(x) 
h 



dt. 
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Por consiguiente 

q-(x + he k ) — cf{x) 


J D k f(x, t ) dt = J {DfcV’Cz, 0 - D k yj(x, /)} dt. 


La ultima integral tiene un valor absoluto que no excede 

I* I D Mz, t ) - D k f(x, t)\dt <(b - a) max | Ay<z, t) - D k f(x, t)| 


en donde el maximo es alcanzado para todo z del segmento que une x con 
v + he k , y todo t de [a, b~\. Teniendo en cuenta la continuidad uniforme de Dk 
en S X J (teorema 9.10) llegamos a la conclusion de que para todo e > 0 existe 
un 8 > 0 tal que ese maximo es < e/(b — a), siempre que 0 < \h\ < 8. Por lo 
tanto 


(f(x + he k ) - (fix) 


-/> 


fix, t) dt 


< c siempre que 0 < j/i | < <5. 


Esto demuestra que D k (pix) existe y es igual a Dk^tx, t) dt, como queriamos 
demostrar. 


Utilizaremos ahora este teorema para dar la siguiente condicion necesaria 
y suBciente para que un campo vectorial sea un gradiente en un conjunto con- 
vexo. 


teorema 10.9. Sea /=(/»,...,/«) un campo vectorial diferenciable con 
continuidad en un conjunto convexo abierto S de R". El campo f es un gradiente 
en S si y solo si 

(10.18) A fjix) = Djfkix) 

para cada x de S y todos los indices k, j = 1,2 

Demostracidn. Sabemos, por el teorema 10.6, que las condiciones son ne- 
cesarias. Para demostrar la suficiencia, supongamos (10.18) y construyamos un 
potencial cp en S. 

Supongamos, para simplificar, que S contenga el origen. Seay: (a:) la integral 
de / a lo largo del segmento de recta que une O con un punto cualquiera x 
de S. Como antes se ha visto en la ecuacion (10.10) tenemos 


(p{x) = \' 0 f(tx) ■ xdt = £ fix, t ) dt, 
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en donde y(x, t) — f(tx) ■ x. Existe un subintervalo cerradon-dimensional Tde S 
con interior no vacio tal que ^ satisface las hipotesis del teorema 10.8 en T X /, 
siendo J — [0,1]. Por consiguiente la derivada parcial D k cf(x ) existe para cada 
valor k = 1,2, ... ,n y puede calcularse derivando bajo el signo integral, 

D k<f O) = f g D k rp(x, t ) dt. 

Para calcular D k y>(x, t ), derivamos el producto escalar f{tx) ■ x y obtenemos 

DMx, 0 = f(tx) ■ D k x + D k {f(tx)} ■ x 

= f(tx ) • e k + t(D k fi(tx), , D k f n (tx)) • x 
= /*('*) + <(DJ k Ux), ..., D n f k (tx)) x, 

habiendo utilizado en el ultimo paso la relacion (10.18). Tenemos por lo tanto 

D k f(.x, t) =f k {tx) -p tVf k (tx) ■ x. 

Pongamos ahora g(t) = f k (tx). Segun la regia de la cadena tenemos 

g'(0 = V/ fc (tx) ■ x 

asf que la ultima formula que da D k y(x, t) toma la forma 

DMx, t ) = g(t) + tg'{t). 

Integrandola entre 0 y 1 encontramos 

(10.19) DMx) = £ DMx, t) = \ g g(t) dt + fg'(0 dt. 

Integremos por partes la ultima integral y obtenemos 

Jo t S'( t ) dt = tg(t) |^- Jj g(f) dt = g(l) - J o ‘ g(t) dt. 

Por consiguiente (10.19) toma la forma 

DMx) =g(l) =f k (x). 

Esto demuestra que Vy = / en S, lo cual completa la demostracion. 
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11.1 Introduction 

En el volumen I se estudlaron las integrales fix) dx, primero para fun- 
ciones definidas y acotadas en intervalos finitos, y luego para funciones no aco- 
tadas e intervalos infmitos. En el capitulo 10 del volumen II se ha generalizado 
el concepto de integral introduciendo las integrales de linea. Este capitulo extien- 
de el concepto en otra direction. El intervalo unidimensional [a, b] se reemplaza 
por un conjunto Q bi-dimensional, llamado region de integracidn. Consideremos 
primero regiones rectangulares; luego consideraremos regiones mas generates con 
contornos curvilineos. El integrando es un campo escalar / definido y acotado en 
Q. La integral que resulta se llama integral doble y se representa mediante los 
simbolos 


jjf, o J / f(x, y) dx dy. 

Q Q 

Como en el caso uni-dimensional, los simbolos dx y dy no desempenan 
ningun papel en la definicion de la integral doble; no obstante, son utiles en el 
calculo y transformation de integrales. 

El programa de este capitulo consta de varias partes. Discutimos primero 
la definicion de integral doble. La introduction es analoga al caso uni-dimensional 
tratado en el volumen I. Se define la integral primero para funciones escalonadas 
y luego para funciones mas generales. Como alii, la definicion no proporciona 
un metodo para el calculo efectivo de las integrales. Veremos que gran numero 
de integrales dobles que se presentan en la practica pueden calcularse por inte¬ 
gration unidimensional reiterada. Encontraremos tambien una conexion entre 
las integrales dobles y las de linea. Asimismo se dan aplicaciones de las integrales 
dobles a problemas de areas, volumenes, masas, centros de gravedad y conceptos 
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relacionados con aquellos. Por ultimo indicamos el modo de extender los con- 
ceptos al espacio de n dimensiones. 

11.2 Particiones de rectangulos. Funciones escalonadas 

Sea Q un rectangulo, producto cartesiano de dos intervalos cerrados [a, b ] 
y [c,d], 

Q = [a, b ] X [c, d] = {(x, y)\xe[a,b] e ye [c, d]}. 


y 
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Figura 11.1 Rectangulo Q producto Figura 11.2 Particion de un rectangulo Q. 
cartesiano de dos intervalos. 


La Figura 11.1 muestra un ejemplo. Consideremos dos particiones P x y P 2 de 
[a, b] y [c, d], respectivamente, 


Pi = {x 0 , x,,-, x n _!, x„} y P 2 = {v 0 , _V’i, • • ■ , y m -x, J™}. 

donde x„ = a, x n = b, y„ = c, y m = d. Se dice que el producto cartesiano P, XP 2 
es una particion de Q. Puesto que P x descompone [a, b] en n subintervalos y P 2 
descompone [c,d] en m subintervalos, la particion P = P x xP. descompone Q en 
mn subrectangulos. La figura 11.2 muestra un ejemplo de particion de Q en 30 sub- 
rectangulos. Una particion P' de Q se llama mas fina que P si P £ P', esto es, si 
todo punto de P pertenece tambien a P'. 

El producto cartesiano de dos subintervalos abiertos de P, y P 2 es un sub- 
rectangulo abierto (sin lados). Se llama subrectangulo abierto de P o de Q. 
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definici6n de funcion escalonada. Una funcidn f definida en un rec- 
tangulo Q se llama escalonada si existe una particion P de Q tal que f es constante 
en cada uno de los subrectangulos abiertos de P. 

En la figura 11.3 se muestra un ejemplo de una tal funcion escalonada. Una 
funcion escalonada tambien posee valores precisos en cada uno de los puntos 



Figura 11.3 Grafica de una funcidn escalonada definida en un rectangulo Q. 


de los contornos de los subrectangulos, pero los valores en esos puntos no tienen 
importancia en la teoria de la integration. 

Si / y g son dos funciones escalonadas definidas en un rectangulo dado Q, 
la combination lineal cj + c 2 g tambien es una funcion escalonada. En efecto, 
si P y P son particiones de Q tales que / es constante en los subrectangulos 
abiertos de P y g es constante en los subrectangulos abiertos de P', entonces 
c,/ + c 2 g es constante en los subrectangulos de la reunion PuF (que podemos 
llamar afinamiento de P y P'). Asf pues, el conjunto de funciones escalonadas 
definidas en Q forma un espacio lineal. 

11.3 Integral doble de una funcion escalonada 

Sean P = P, X P 2 una particion del rectangulo Q en mn subrectangulos y 
f una funcion escalonada, esto es, constante en los subrectangulos abiertos de Q. 
Designemos por Q,-,- el subrectangulo determinado por x,] e y sea 

cij el valor constante que toma / en los puntos interiores de Q,,. Si / es positiva, el 
volumen de la caja rectangular con base Q,,- y altura c,,- es el producto 


C ij ' *i-l)Ob yi-l) ■ 
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para toda funcion escalonada /, positiva o no, la suma de todos esos productos se 
toma como definicion de integral doble de / sobre Q. Asi pues, tenemos la si- 
guiente definicion. 

DEFINICION DE LA INTEGRAL DOBLE DE UNA FUNCION ESCALONADA. Sea f 
una funcion escalonada que toma el valor constante cy en el subrectangulo abierto 
(*,_!, X,) X (y,-i, yj) de un rectangulo Q. La integral doble de f en Q esta defi 
nida por la formula 

(11.1) J J / = 2 2 c u • ( x i - i) • 

Q <=13=1 

Como en el caso unidimensional, el valor de la integral no varia si la parti- 
cion P se sustituye por otra partition mas fina P'. Asi, pues, dicho valor es inde- 
pendiente de la election de P con tal que / sea constante en los subrectangulos 
abiertos de Q. 

Por brevedad, escribimos algunas veces Ax, en lugar de (x, — x.-J y Ay,- en 
lugar ‘de (y— yy la suma (11.1) se convierte en 

n m 

2 2 c a ^ x i ^yj ■ 

1 = 1 3=1 

Para recordar como se forma esta suma, podemos escribir la integral en la forma 

Jj fix, y ) dx dy. 

Q 

Este simbolo no es mas que otra notacion para JJ/. 

Q 

Observese que si / es constante en el interior de Q, es decir /(x, y) = k si 
a < x < b y c < y < d, tenemos 

(11.2) JJ f=k(b-a)(d-c), 

Q 

prescindiendo de los valores de / sobre los lados de Q. Puesto que 
b-a=j b a dx y C l- C=z jy y> 
la formula (11.2) puede tambien escribirse asi 

( 11 . 3) J J / = /" [J,," fix, y) dx] dy = [ b [jj/(x, y) dy] dx . 
o 
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Las integrates que aparecen en el segundo miembro son unidimensionales, y se 
dice que la formula proporciona el valor de la integral doble por integration re- 
petida o por integraciones sucesivas. En particular, si aplicamos esta formula 
cuando / es una funcion escalonada del tipo antes descrito, podemos escribir: 

JJ/-J':;,[ S'' /<*• *] *y - Il,[ S"L Ax - y)dy S *>• 

Qa 


Sumando respecto a i y / y usando (11.1), encontramos que (11.3) es valida’para 
funciones escalonadas. 

Las otras propiedades que siguen de la integral doble de una funcion esca¬ 
lonada son generalizaciones de los correspondientes teoremas unidimensionales. 
Pueden demostrarse como consecuencias inmediatas de la definition (11.1) o 
mediante la formula (11.3) y los teoremas correspondientes para las integrales 
unidimensionales. En los teoremas siguientes los sfmbolos s y t representan fun¬ 
ciones escalonadas definidas en un rectangulo Q. Para eludir casos particulares 
triviales suponemos que Q es un rectangulo no degenerado; en otras palabras, 
que Q no es tan solo un punto o un segmento rectilineo. 

teorema 11.1. linealidad. Cualesquiera que sean los numeros reales 
Cj y c 2 tenemos 

J J [CiS(x, y) + c 2 f(x, y)] dx dy = c l J J s(x, y ) dx dy + c 2 j j t(x, y) dx dy. 

0 Q Q 

teorema 11.2. aditividad. Si Q esta subdividido en dos rectangulos 

Qi y Q 2 , 


J j s(x, y) dx dy = j j s(x, y) dx dy + j j s(x, y ) dx dy. 

Q Qi Oj 

teorema 11.3. teorema de comparaci6n. Si s(x, y)< t(x, y) para todo 
(x, y) de Q, entonces 


JJ s(x, y)dxdy < J J t(x, y) dx dy. 

Q Q 

En particular, si t(x, y) > 0 para todo (x, y) de Q, entonces 

J J f(x, y) dx dy > 0. 

Q 
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Dejamos como ejercicios las demostraciones de esos teoremas. 

11.4 Definition de integral doble de una funcion definida y acotada en un 
rectangulo 

Sea / una funcion definida y acotada en un rectangulo Q; en particular, su- 
pongamos que 


|/(x, v)| < M si (x,y)eQ. 

Entonces la funcion / puede quedar limitada por encima y por debajo por dos 
funciones escalonadas constantes s y t, siendo s(x, y) = — M y t(x, y) = M part 
todo (x,y) en Q. Consideremos ahora dos funciones escalonadas cualesquierc 
s y t, definidas en Q, tales que 

(11.4) s(x, y ) <f(x,y ) < t(x, y) para todo punto (x, y) de Q. 

DEFINICION DE LA INTEGRAL DE UNA FUNCI6N ACOTADA EN UN RECTANGULO. 

Si existe un numero I y solamente uno tal que 

(11.5) J7 s<I< /■/ r 

Q Q 

para todo par de funciones escalonadas que satisfagan las desigualdades (11.4), 
dicho numero I se llama integral doble de / extendida a Q y se representa por el 
slmbolo 


jjf o jj f(x, y) dx dy. 

Q Q 

Cuando existe tal numero I se dice que la funcion f es integrable en Q. 

11.5 Integrates dobles superior e inferior 

La definition de integral doble es completamente analoga al caso uni-di¬ 
mensional. 

Supongamos que f es acotada en un rectangulo Q y sean s y t dos funciones 
escalonadas que satisfacen (11.4). Decimos que s esta por debajo de f, y t esta 
por encima de f, y escribimos s < / ^ t. Designemos con S el conjunto de todos 

los numeros JJ s obtenidos al tomar como s todas v cada una de las funciones 
Q 
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escalonadas por debajo de f, y sea T el conjunto de todos los numeros JJ t obte- 

Q 

nidos al tomar como s todas y cada una de las funciones escalonadas por encima 
de /. Ambos conjuntos S y T son no vacfos puesto que / es.acotada. Asimismo, 

JJ s <; jj t si s < / < /, asi que todo numero de S es menor que todo numero 
o o 

de T. Por consiguiente S tiene un extremo superior, y T tiene un extremo infe¬ 
rior, que satisfacen las desigualdades 

J/s ^ sup S ^ inf r ^ JJf 

0 Q 

para toda s y toda t que satisfagan s < f < t. Esto prueba que los dos numeros 
supS e inf T satisfacen (11.5). Por lo tanto, / es integrable en Q si y solo si 
sup S = inf T, en cuyo caso tenemos 

J J" / = sup S = inf T. 

Q 

El numero sup S se llama integral inferior de / y se representa por 1(f). 
El numero inf T es la integral superior de / y se representa por 1(f). Asi pues, te¬ 
nemos 


1(f) = sup |/J s | s </j , 1(f) = inf // t \f < j . 

El razonamiento anterior demuestra el siguiente teorema. 

teorema 11.4. Si una funcion f acotada en un rectangulo Q tiene una 
integral inferior 1(f) y una integral superior 1(f) que satisfacen las desigualdades 

/J s < i(f) <: Kf) <jjt 

Q Q 

para todas las funciones escalonadas s y t que cumplen s < / < t, la funcion f 
es integrable en Q si y solo si sus integrates superior e inferior son iguales, en 
cuyo caso tenemos 


///=/(/) = /(/)• 

Q 
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Puesto que las definiciones anteriores son del todo analogas a las del caso 
uni-dimensional, no debe sorprender que las propiedades de linealidad y aditi- 
vidad y el teorema de comparacion establecidos para funciones escalonadas en la 
seccion 11.3, sean validas tambien para las integrales dobles en general. Las 
demostraciones de esas propiedades son analogas a las del caso uni-dimensional 
y las omitiremos. 

11.6 Calculo de una integral doble por integracion uni-dimensional reiterada 

En la teorfa de la integracion unidimensional, el segundo teorema funda¬ 
mental del calculo proporciona un metodo para calcular integrales sin exigir la 
definicion de integral en cada caso. El teorema siguiente logra el mismo resultado 
en dos dimensiones, y nos permite calcular ciertas integrales dobles mediante 
dos integraciones unidimensionales sucesivas. El resultado es una extension de la 
formula (11.3), que ya hemos demostrado para funciones escalonadas. 

teorema 11.5. Sea f una funcion definida y acotada en un rectangulo 
Q = [a, b ] X [c, d\, y supongamos que f es integrable en Q. Supongamos que 
para cada y fija en [c, d] la integral uni-dimensional J* fix, y) dx exista, y desig- 
nemos su valor por /4(y). Si existe la integral f d A(y), es igual a la integral doble 
JJ7- Es decir, tenemos la formula . 

Q I 

C 1 L6 ) J J f(x, y ) dx dy = Jf [ \j( x , y) dx] dy . 

Q 

Demostracion. Elijamos dos funciones escalonadas. cualesquiera s y t que 

satisfagan en Q. Integrando con respecto a x en el intervalo°[a, b] 

tenemos 


i < x > y) dx < A(y) < j* t( x , y) dx . 


Puesto que la integral $ d c A(y) dy existe, podemos integrar esas dos desigualdades 
con respecto a y en [c, d] y aplicar la ecuacion (11.3) obteniendo 

// t. 

« 0 

Por consiguiente $ d 4(y) dy es un numero comprendido entre ffsefft para 

todas las funciones s y t que aproximan f por debajo y por encima, respectiva- 
mente. Puesto que / es integrable en Q, el unico numero con esa propiedad es la 
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integral doble de / en Q. Por tanto $ d c A(y) dy = JJ /, lo que demuestra la ecua- 
cion (11.6). Q 

Se dice que la formula (11.6) proporciona una evaluacion de la integral 
doble mediante integracion reiterada o repetida. El proceso consists pues en 
integrar / respecto a x entre a y b (dejando fija y), y luego se integra el resultado 
respecto a y entre c y d. Si invertimos el orden de integracion, obtenemos una 
formula parecida, a saber, 

(11.7) J J /(*, y) dx dy = £ [j>, y) dy] dx, 

0 

que es valida si suponemos que f(x,y)dy existe para cada x fija en [a, b] y 
que es integrable en [a, b], 

11.7 Interpretacion geometrica de la integral doble como un volumen 

El teorema 11.5 tiene una sencilla interpretacion geometrica, representada en 
fa figura 11.4. Si f es no negativa, el conjunto S de los puntos (x,y, z) en el es- 
pacio 'de tres dimensiones tales que (x, y) esta en Q y f(x, y) se llama 



Figura 11.4 El volumen de S es la integral del area de la section: 
v(S) = j] A(y) dy. 





440 


Integrates multiples 


conjunto de ordenadas de j sobre Q. Consta de los puntos comprendidos entre el 
rectangulo Q y la superficie z = f(x, y). (Vease figura 11.4 a).) Para cada y en 
el intervalo [c,d], la integral 

My) = j b f(x, y) dx 

J a 

es el area de la seccion producida en S por un piano paralelo al piano xz (la 
region sombreada en la figura 11.4 b)). Puesto que el area de la seccion A(y) 
es integrable en [c, d], el teorema 2.7 del volumen / nos dice que la integral 
Jo My) dy es igual a v(S), el volumen de S. Asi pues, para integrandos no nega¬ 
tives, el teorema 11.5 muestra que el volumen del conjunto de ordenadas de / 
sobre Q es igual a la integral doble JJ /. 

Q 

La formula (11.7) nos da otro camino para calcular el volumen del con¬ 
junto de ordenadas. En ella integramos el area de las secciones producidas por 
pianos paralelos al piano yz. 

11.8 Ejemplos resueltos 

En esta seccion ilustramos el teorema 11.5 con dos ejemplos numericos. 

EJEMPLO 1. Si Q = [ -1 , 1 ] X [0, tt/ 2], calcular JJ (x sen y - ye*) dx dy : 

Q 

en el supuesto de que la integral exista. La region de integracion esta represen- 
tada en la figura 11.5. 




V 


Figura 11.5 Region de integracion para Figura 11.6 Region de integracion para 
el ejemplo 1. ei e j etnp i 0 2 . 
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Solution. Integrando primero respecto a x y llamando al resultado A(y), 
tenemos 

My) — J (xseny — ye x ) dx = ^-seny — ye x j * 1 = — ey + y/e. 

Aplicando el teorema 11.5 encontramos 

// (* sen y - ye*) dx dy = j^My) dy = j' /2 (-ey + y/e) dy 
Q 

= (l/« ~ e) j’' 2 y dy = (1/e - e)7r 2 /8. 

Como comprobacion del calculo podemos integrar primero respecto a y: 

JJ (x seny — ye x ) dx dy = J*^ [ j ’ 12 (x seny — ye x ) dy] dx 
Q 

= /_] (~ x cos ^ _ iA*) |[^ /2 dx 

= f* (-ttV/ 8 + x) dx = (1/e - e)7r 2 /8. 

ejemplo 2. Si Q = [ — 1, 1] X [0, 2], calcular la integral doble 
JJ v /|-y _ x 2 | dx dy, sqpuesta su existencia. 

Q 

Solution. S i integram os primero respecto a y y el resultado es H(x), tene¬ 
mos H(x) = J 2 V |y — x 2 [ dy. La region de integracion es el rectangulo de la 
figura 11.6. La parabola y = x 2 esta alii dibujada debido a la presencia de 
|y — x 2 |en el integrando. Por encima de esa parabola se tiene y > x 2 y por de- 
bajo y < x 2 . Esto nos sugiere que escindamos la integral de H(x) del modo si- 
guiente: 

H{x) = j 2 V|y - x 2 | dy = /“ Vx 2 - ydy 4- J] 2 v'y - x 2 dy. 

Recordemos que x se considera constante en cada una de esas integrales. En la 
primera efectuamos el cambio de variable t = x 2 — y y en la segunda t = y — x z . 
Esto nos da 

H ( x ) = J 0 *\/|y - x 2 \ dy = -j^y/tdt + j 2 ~ X \t dt = fx 3 + f(2 - x 2 ) 3/2 . 
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Aplicando el teorema 11.5 encontramos 


JJ Vb - x 2 l dxdy = f [f x 3 + | (2 - x 2 ) 3/2 ] dx = | f (2 - x 2 f 2 dx 

Q J — 1 JO 

= ^x(2 — x 2 ) 3/2 + 3xV2 — x 2 + 6 arc sen J j = ^ ^ ■ 

Analogo resultado se consigue invirtiendo el orden de integracion, pern los calcu- 
los son mas complicados. 

11.9 Ejercicios 


Calcular las integrales dobles por integracion sucesiva en los ejercicios del 1 al 8, su- 
puesta la existencia de cada integral. 

!• // xy(x +y)dxdy, donde Q = [0, 1] x [0, 1]. 

Q 

2. J J (x 3 + 3 x 2 y + f) dx dy, donde Q = [0, 1] x [0,1], 

Q 

3 ' J7 + x ~ 3 xy 2 )dxdy, donde Q = [0, 1] x [1,3]. 

Q 

4 - JJ sen 2 x sen 2 y dx dy, donde Q = [0, w] x [0, n], 

Q 

5 - JJ sen (x +y)dxdy, donde Q = [0, nj2] x [0, n/2]. 

Q 

6. j j |cos (x +y)\ dxdy, donde Q = [0, it] x [0, it], 

Q 

7 - J JV ( * + y) dxd y> donde Q = [0,2] x [0,2], y fit) representa el mayor 
Q 

entero <, t. 

8- \\y~* etx/v dxdy, donde Q = [0, t] x [1 ,t],t >0. 

Q 

9. Si Q es un rectangulo, demostrar que una integral doble de la forma JJ f(x)g(y) dx dy 

es igual al producto de dos integrales unidimensionales. Establecer las hipotesis relati- 
vas a la existencia. 
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10. Sea f una funci6n definida en el rectangulo Q = [0,1] X [0,1] del siguiente modo: 

1 — x — y six+j^l, 

0 en los demas puntos de Q. 

Representar el conjunto de ordenadas de f sobre Q y calcular su volumen por doble 
integracion (Supdngase la existencia de la integral.) 

11. Resolver el ejercicio 10 cuando 


f(x,y) = 




(x+y 

1 ° 


si x 2 <, y <, lx 2 , 
en los demas puntos de Q. 


12. Resolver el ejercicio 10 cuando Q = [ — 1,1] X [ — 1,1] y 


f(x,y) 


jx 2 + y 2 si x 2 +y 2 £ 1, 

|0 en los demas puntos de Q. 


13. Sea / una funcion definida en el rectangulo Q = [1,2] X [1,4] del siguiente modo: 


f(x,y) 


\x+y)~ 2 si x<,y<,2x, 

0 en los demas puntos de Q. 


Indicar, mediante un dibujo, la porcion de Q en la que / es no nula y calcular el valor 
de la integral doble jj f, supuesta su existencia. 

Q 

14. Sea / una funcion definida en el rectangulo Q = [0,1] X [0,1] del. siguiente modo: 


o 


f(x,y) 


si x=y, 
si x y. 


Demostrar la existencia de la integral doble JJ / y que es igual a 0. 

Q 


11.10 Integrabilidad de funciones continuas 

El teorema de la continuidad uniforme (teorema 9.10) puede aplicarse para 
demostrar la integrabilidad de una funcion continua en un rectangulo. 

TEOREMA 11.6. INTEGRABILIDAD DE FUNCIONES CONTINUAS. Si U1W fun- 
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cion f es continua en un rectangulo Q = {.a, 6] X [c, d], entonces f es integra¬ 
te en Q. Ademas, el valor de la integral puede obtenerse por integracion su- 
cesiva, 

(n.S) JJ7 = J" [f* f( x ’ y) dx i dy = £ [f c a /(x, y) dy] dx. 

Q 

Demostracion. El teorema 9.8 demuestra^que / es acotada en Q, por lo que 
/ tiene una integral superior y una integral inferior. Demostraremos que 
/(/) = /(/). Elijamos e > 0. Segun el teorema de la continuidad uniforme, para 
ese e existe una partition P de Q en un numero finito (por ejemplo n) de sub- 
rectangulos Q u ... ,Q„ tal que la oscilacion de / en todo subrectangulo es me- 
nor que e. Designemos con M k (f) y m k (f), respectivamente, los valores maximo 
y minimo absolutos de / en Q*. Tenemos entonces 

M k {f) - m k (f) < e 

para cada k = 1,2,,n. Sean ahora s y t dos funciones escalonadas definidas 
en el interior de cada Q k asf: 

s(x) = m k (f), t(x) = M k (f) si x 6 int Q k . 

En los puntos frontera definamos s(x) = m y t(x) = M, siendo m y M, respec- 
tivamente, los valores minimo y maximo absolutos de / en Q. Tenemos entonces 
s < / ^ t para todo x de Q. Asimismo, tenemos 


J J s = i m k(f) a (Qk) y JJ t = i M k (f)a(Q k ), 

Q k=1 Q k=1 

en donde a(Qk) es el area del rectangulo Qk- La diferencia de esas dos integra¬ 
ls es 


JJ * - J7 S =imf) - m k(f )}a(Qk) < tia(Q k ) = ea(Q), 

0 Q * _1 • * _1 

en donde a(Q) es el area de Q. Puesto que JJ s <, 1(f) < 1(f) < JJ t obtenemos 
la desigualdad Q Q 

0 ^ /(/) - /(/) <£ ea(Q). 

Haciendo que e -> 0 vemos que /(/) = 1(f), por lo que / es integrable en Q. 
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Demostramos seguidamente que la integral doble es igual a la integral 
reiterada de (11.8). Para cada y fija de [c, d] la integral unidimensional 
P a f(x, y) dx existe ya que el integrando es continuo en Q. Sea A( y)= fix, y)dx. 
Demostraremos que A es continua en [c, d]. Si y e y, son dos puntos cualesquie- 
ra de [c, d] tenemos 

A(y) - A(yi) = £ {/(*> y ) - fix, y x )} dx 
de la que obtenemos 

| A{y) - ^(yOl < (b - a) max \f(x, y) -f(x, y x )| = (b - a) | f(x 1 ,y) -f(x x , y x )| 

a<x<b 


en donde x t es un punto de [a, 6] en el que [fix, y) — fix, y x )| alcanza su maxi- 
mo. Esta desigualdad demuestra que A( y) -»/4(y x ) cuando y -» y lt asf que A es 
continua en y x . Por consiguiente existe la integral /4(y) dy y, segun el teorema 
11 . 5 , es igual a JJ f. Se sigue un razonamiento parecido cuando el orden de in- 
o 

tegracion se invierte. 

11.11 Integrabilidad de funciones acotadas con discontinuidades 

Sea / una funcion definida y acotada en un rectangulo Q. En el teorema 
11.6 se demostro que la integral doble de f sobre Q existe si / es continua en 
todos los puntos de Q. En esta seccion demostramos que tambien existe la inte¬ 
gral si / tiene discontinuidades en Q, con tal que el conjunto de las disconti¬ 
nuidades no sea demasiado grande. Para medir el tamano del conjunto de 
discontinuidades introducimos el concepto siguiente. 

DEFINICldN DE CONJUNTO ACOTADO DE CONTENIDO NULO. Sea A UH SUbcon- 
junto acotado del piano. Se dice que el conjunto A tiene contenido nulo si para 
todo e > 0 existe un conjunto finito de rectangulos cuya reunion contiene A y 
cuya suma de areas no supera e. 

Es decir, un conjunto piano acotado de contenido nulo puede cubrirse con 
una reunion de rectangulos cuya area total sea tan pequena como se quiera. 

Las siguientes proposiciones relativas a los conjuntos acotados de contenido 
nulo son sencillas consecuencias de esa defmicion. Dejamos al lector las demos- 
traciones. 

a) Cualquier conjunto finito de puntos del piano tiene contenido nulo. 

b) La reunion de un numero finito de conjuntos acotados de contenido 

nulo tambien es de contenido nulo. 

c) Todo subconjunto de un conjunto de contenido nulo tiene contenido 

nulo. 



446 


Integrates multiples 


d) Todo segraento de recta tiene contenido nulo. 

teorema 11.7. Sea f una funcion definida y acotada en un rectangulo 
Q = [a, b] X [c, d], Si el conjunto de discontinuidades de f en Q es un con- 
junto de contenido nulo existe la integral doble JJ /. 

Q 

Demostracion. Sea M > 0 tal que |/| ^ M en Q. Llamemos D al conjunto 
de discontinuidades de / en Q. Dado 8 > 0, sea P una particion de Q tal que la 
suma de las areas de todos los subrectangulos de P que contienen puntos de D 
sea menor que 8.(Estb es posible puesto que D tiene contenido nulo.) Definamos 
en esos subrectangulos las funciones escalonadas s y t como sigue: 

$(*) = —M, t(x ) = M. 

En los subrectangulos de P restantes definamos s y t como se hizo en la demos- 
tracion del teorema 11.6. Tenemos entonces sffft en todo Q. Razonando 
como en la demostracion del teorema 11.6 obtenemos la desigualdad 

(11.9) jjt-jjs£ea(Q) + 2Mb. 

Q Q 

El primer termino, ea(Q), precede del calculo de la integral de t — s en los 
subrectangulos que solo contienen puntos de continuidad de /; el segundo termino, 
2M8, precede de la integral de t — s en los subrectangulos que contienen puntos 
de D. De (11.9) obtenemos la desigualdad 

0 < 1(f) - 1(f) < ea(Q) + 2Mb. 

Haciendo que e -> 0 encontramos 0 < 1(f) —/(/)< 2M8. Puesto que 8 es arbi¬ 
trary esto implica que 1(f) = 1(f), asi que / es integrable en Q. 

11.12 Integrates dobles extendidas a regiones mas generates 

Hasta aqui la integral doble solo se ha definido para regiones de integracion 
rectangulares. No obstante, no hay dificultad para extender el concepto a regio¬ 
nes mas generales. Sea S una region acotada, e incluyamos S en un rectangulo Q. 
Sea / una funcion definida y acotada en S. Definamos una nueva funcion/ en Q 
del siguiente modo: 


( 11 . 10 ) 


Kx,y) 


\Kx,y) 

0 


si (x,y)eS, 
si (*,/) e g - S'. 
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Es decir, extendemos la definicion de / a todo el rectangulo Q haciendo que la 
funcion valga 0 fuera de S. Nos preguntamos ahora si la funcion / es o no inte- 
grable en Q. Si lo es, decimos que / es integrable en S y que, por definicion, 

JJ/-JJ/. 

S Q 

Consideremos primero conjuntos S de puntos del piano xy definidos asi: 

S = {(x, y) | a <, x < b y y^x) <y < y 2 {x )}, 

en donde y x y <f 2 son funciones continuas en un intervalo cerrado [a, 6 ] que sa- 
tisfacen Ejemplo de una tal region, que llamamos region del tipo I, es el 

de la figura 11.7. En una region del tipo I, para cada punto t de [a, b] la recta 
vertical x = t corta a S en un segmento que une la curva y =yi(x) a y =<p 2 (x). 
Una tal region es acotada porque y x y y, son continuas y por tanto acotadas en 
la,bl 

Otro tipo de region T (tipo II) puede defmirse asi: 

T = {(x,y)\c <7 <d y y^y) < x < y 2 (y )}, 


en donde y son continuas en un intervalo [c, d] siendo En la figu¬ 

ra 11.8 se muestra un ejemplo. En este caso las rectas horizontales cortan T en 



Figura 11.7 Region S de tipo I. 


Figura 11.8 Region T de tipo II. 
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segmentos que unen las curvas x t = ^(y) y x 2 = f,(y). Las regiones del tipo II 
tambien son acotadas. Todas las regiones que consideraremos seran de uno u 
otro de esos dos tipos o podran descomponerse en un numero frnito de fragmen- 
tos, cada uno de los cuales sera de uno de esos dos tipos. 

Sea / una funcion definida y acotada en una region S de tipo I. Incluya- 
xnos S en un rectangulo Q y definamos / en Q como esta indicado en la ecuacion 
(11.10). Las discontinuidades de / en Q seran las de / en S y ademas aquellos 
puntos de la frontera de S en los que / no es cero. La frontera de S esta cons- 
tituida por las graficas de ff v , de cp 2 y por los dos segmentos de recta verticales 
que unen los extremos de las graficas. Cada uno de esos segmentos de recta tiene 
contenido nulo. El teorema que sigue demuestra que cada una de las graficas tam¬ 
bien tiene contenido nulo. 

teorema 11.8. Si (f es una funcion real continua en un intervalo [ a,b ], 
entonces la grafica de <p tiene contenido nulo. 

Demostracidn. Designemos con A la grafica de <p, esto es, pongamos 

A = {(.r, y) | y = <p(x) y a < x < b). 

Elijamos cualquier e > 0. Apliquemos el teorema de la continuidad uniforme 
(teorema 3.13 del volumen I) para obtener una particion P de [a, b] en un nu¬ 
mero finito de subintervalos tales que la oscilacion de <p en todo subintervalo de 
P sea menor que e/(b — a) Por consiguiente, en cada subintervalo de P la gra¬ 
fica de rp esta dentro de un rectangulo de altura e/(b - a). Luego toda la gra- 



“ b 


Figura 11.9 Demostracidn de que la grafica de una funcion continua <p tiene contenido nulo. 
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fica de <p queda incluida en una reunidn finita de rectdngulos, cuya suma de areas 
es e. (Vease la figura 11.9.) Esto demuestra que la grafica de <p tiene contenido nulo. 

El teorema siguiente demuestra que la integral doble // / existe si / es con¬ 
s' 

tinua en int S, (el interior de S). Este es el conjunto 

int S = {(*, y) | a < x < b y (pfx) < y < <p 2 (xj}. 

teorema 11.9. Sea S una region del tipo I, comprendida entre las graficas 
de <p x y <p 2 . Supongamos que f esta definida y es acotada en S y que es continua 
en el interior de S. Existe entonces la integral doble fj / y puede calculate me- 
diante integracion uni-dimensional reiterada. ' 

(11.11) JJ /(*, y) dx dy = j* y) dy] dx. 

s 

Demostracion. Sea Q = [a, b] X [c, d] un rectangulo que contiene S, y 
sea / la funcion definida en (11.10). Los unicos puntos que pueden ser de dis- 
continuidad para / son los de la frontera de S. Puesto que la frontera de S tiene 
contenido nulo, / es integrable en Q. Para cada x de (a, b) fijo existe la integral 
unidimensional Jf/ (x, y) dy puesto que el integrando tiene a lo mas dos discon- 
tinuidades en [c, d], Aplicando la version del teorema 11.5 dada en la ecuacion 
(11.7) tenemos 

(11.12) JJ7= £ [(Vi*, y) dy] dx. 

Q 

Si <pfx) < y < f 2 (x), f(x,y) = f(x, y), y para los demas valores de y en [c, d], 
fix, y) = 0. Por consiguiente 

f/(*> y)dy = S^Jfix, y) dy 


por lo cual la ecuacion (11.12) implica (11.11). 

Existe, naturalmente, un teorema analogo para una region T del tipo II. 
Si / esta definida y es acotada en T y es continua en el interior de T, f es inte¬ 
grable en T y la formula para la integracion reiterada es ahora 

(11.13) JJ fix, y) dx dy = f" [Jj’^ f(x, y) dx] dy. 

T 

Ciertas regiones son del tipo I y del tipo II a la vez. (Por ejemplo regiones 
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limitadas por circunferencias y elipses.) En estos casos el orden de integration es 
indiferente y podemos escribir 

f CO* y) dy i dx = a [/rd) ,/(x > y') dx ~\ dy • 

En algunos casos una de esas integrales puede ser de calculo mas sencillo que 
la otra; es conveniente examinarlas antes de intentar el calculo. 

11.13 Aplicaciones a areas y volumenes 

Sea S una region del tipo I dada por 

s = i( x >y) \a<x< ! b y ^(x) < y <, <p 2 (x )}. 

Aplicando el teorema 11.9 poniendo fix, y) = 1 para todo (x, y) de S obtenemos 

J7 dx d y = f a fazO) - 9>i(*)] dx. 

s 

Segun el teorema 2.1 del volumen I, la integral del segundo miembro es igual al 
area de la region S. Asi pues, las integrales dobles pueden emplearse para calcular 
areas. 

Si f es no negativa, el conjunto de puntos (x, y, z) del espacio de tres dimen¬ 
sions tales que (x, y)eS y 0 ^ z ^ f(x, y) se denomina conjunto de ordenadas 
de f sobre S. En la figura 11.10 se ve un ejemplo. Si / es no negativa y continua 
en S, la integral 


C >/(x ’ ^ dy 

representa el area de una section del conjunto de ordenadas producida al cortarlo 
por un piano paralelo al piano yz (region sombreada de la figura 11.10). La 
formula (11.11) del teorema 11.9 demuestra que la integral doble de / sobre S 
es igual a la integral del area de las secciones. Luego la integral doble JJ / es 

s 

igual al volumen del conjunto de ordenadas de / sobre S. (Vease el teorema 2.7 
del volumen I, pag. 139.) 

En general, si / y g son ambas continuas en S siendo / < g, la integral doble 

JJ (S ~ /) es igual al volumen del solido comprendido entre las graficas de las 

s 

funciones / y g. A las regiones del tipo II se aplican observaciones analogas. 
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Figura 11.10 La integral f(x, y) dy es el area de la section del conjunto de ordenadas. 

La integral reiterada J* ^ f(.x> y) dx es el volumen del conjunto de ordenadas. 


J <P\(x) J 

fb r [<p 2 (x) 


a LJ Vi(x) 


11,14 Ejemplos resueltos 

ejemplo 1. Calcular el volumen del solido limitado por el elipsoide 

x 2 y 2 z 2 

- \--L. + _ = i . 

a 2 b 2 c 2 


Solution. El solido en cuestion esta comprendido entre las graficas de las 
dos funciones / y g, siendo 


g(x, y) = c \/1 — x 2 \a 2 — y 2 lb 2 f\x. r) = -g(x, y), 


Aquf (x, y)eS, siendo S la region eliptica dada pot¬ 
s' = ((x, y) -- 2 + g < 1 

[ a 2 b~ 

Aplicando el teorema 11.9 y teniendo en cuenta la simetria encontramos que el 
volumen V del solido elipsoidal viene dado por 

V = /J (g - /) = 2 J/ g = 8c £ [| o 6V /a Vl - x 2 la 2 - y 2 lb 2 dy] dx. 
s s 
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Pongamos A = Vl — x 2 ja 2 . La integral interior es 


}* A \!A 2 - y 2 /b 2 dy — A j* A V1 - y 2 /(Ab) 2 dy. 


Mediante el cambio de variable y = Ab sen t, dy = Ab cos t dt, encontramos 
que la ultima integral es igual a 


Por consiguiente 


A 2 b 


J ’ir/2 
0 


cos 2 tdt = - A 2 b = — 
4 4 




En el caso particular a = b— c e 1 solido es una esfera de radio a y el volumen 
es %7rtf 3 . 

ejemplo 2. La integral doble de una funcion positiva /, JJ f(x, y) dx dy, 
se reduce a la integral reiterada « 


lo LC /(x > 

Determinar la region S e intercambiar el orden de integracion. 

Solucidn. Para cada x fijada entre 0 y 1, la integracion con respecto a y se 
efectua en el intervalo entre x 2 y x. Esto significa que la region es del tipo I y 
esta limitada entre los dos curvas y = x 2 e y = x. La region S es el conjunto de 
puntos situados entre las dos curvas y sobre el intervalo [0, 1]. (Vease figura 
11.11) Puesto que S es tambien del tipo II podemos invertir el orden de integra- 
cion obteniendo 


Jo [//*/(*, d y- 

ejemplo 3. Una integral doble de una funcion f, JJ /(x, y) dx dy, se reduce 
a la integral reiterada: s 


f 3 r r ^ 2o—i/ 2 

Jo LJ4V/3 f^y) dx \dy. 

Determinar la region S e invertir el orden de integracion. 
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Solution. Para cada y fija entre 0 y 3, la integration respecto arse efectua 
en el intervalo entre 4y/3 y V 25 — y' 2 . Por lo tan to la regi on es del tipo II y 
’esta limitada por las dos curvas x = 4y/3 y x = V 25 — y 2 . Esta region, repre- 
sentada en la figura 11.12, es un sector circular. Cuando el orden de integration 
se invierte, la region se escinde en dos regiones del tipo I; el resultado es la 
suma de dos integrales: 

Jo* Lf /4 /(*’ y) dy ] dx + f [/o^ /(x ’ y) dy i dx ■ 


11.15 Ejercicios 

En los ejercicios del 1 al 5, dibujar la region de integration y calcular la integral doble. 

1. JJx cos (x + y) dx dy, siendo S el triangulo de vertices (0, 0), O, 0), (tt, n). 

S 

2. JJ (1 + x) sen y dx dy, siendo S el trapezoide de vertices (0,0), (1,0), (1,2), (0,1). 
s 

3. JJ e x+v dxdy, siendo S = {(x,y) | |x| + \y\ <, 1}. 

S 

4. J J dx dy, siendo S la porcion acotada del primer cuadrante situada entre las dos 

hipdrbolas xy — 1 y xy = 2 y las lineas rectas y = x e y = 4x. 

5. JJ (x 2 — y 2 ) dx dy, siendo S la region limitada por y = senx y el intervalo [0, ir ]. 
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6. Una piramide esta limitada por los tres pianos coordenados y el piano x + 2y + 3z = 6. 
Representar el solido y calcular su volumen por doble integracion. 

7. Un solido esta limitado por la superficie z = x 2 - y\ el piano xy, y los pianos x = 1 
y * Representar el solido y calcular su volumen por doble integracion. 

8. Calcular por doble integracion, el volumen del conjunto de ordenadas de / sobre S si: 


a > f(x,y) = X 2 +/ y 

b ) fix, y) = 3x + y y 

c ) f(x>y)*=y + 2x+20 y 

s = iix,y) | |x| < 1 , |y| < 1}. 
s = {(x,y) |4x 2 + 9/ ^ 36, x > 0, v > 0}. 
S = {(x, y) \x 2 + y 2 <, 16}. 

En los ejercicios del 9 al 18 suponer que la integral doble de una funcion positiva / exten¬ 
d'd® a una region S se reduce a la integral reiterada que se da. En cada caso, representar la 
region S e invertir el orden de integracion. 

9 - \l\>>y> dx \ d y- 

14 - dx. 

10 - /oU^H d y- 


n - Slll 7 f (x ’y )d y] dx - 

16 - Slll^y^y] 

12 - Sx[Sz-T x f^y^y] dx - 


13 - S-lS^-v/J^y^y] dx - 

18 - 


19. A1 calcular por doble integracion el volumen V situado debajo del paraboloide 
z = x 2 + y 2 y limitado inferiormente por una cierta region S del piano xy, se ha Uegado 
a la siguiente suma de integrales reiteradas: 


K= £ Ifo 1 ' ( * 2 + y* )dx ] d y + /:[/: v +f)dx] dy. 


Dibujar la region S y expresar V mediante una integral reiterada en la que el orden de 
integracion este invertido. Efectuar, tambien, la integracion y calcular V. 

20. A1 calcular por doble integracion el volumen V limitado por encima por la superficie 
z = /(x, y) y por la parte inferior por una cierta regidn S del piano xy, se ha llegado a 
la siguiente suma de integrales reiteradas: 


V = /; SCTC [f dy + f^y)dx]dy. 


sien do 0 < a < b y 0<c< w/2, dibujar la regidn S dando las ecuaciones de todas las 
curvas que constituyen su frontera. 

21. A1 calcular por doble integracion el volumen V limitado por encima por la superficie 
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z = f(x, y) y por la parte inferior por una cierta regidn S del piano xy, se ha llegado a la 
siguiente suma de integrales reiteradas: 


v = J* [fr f^y )d y\ dx + /*[/; f (x 'y )d y\ dx - 


a) Dibujar la region S y expresar el volumen V mediante una integral reiterada en la 
que el orden de integracion este invertido. 

b) Efectuar la integracion y calcular V cuando f(x, y) = e x {x/y) 1/2 . 

22. Dadas A = l\e~ t2 dt y B= e~ t2 dt. Calcular la integral reiterada. 

7 = 2 LU:^] dx 

en funcion de A y B. Existen enteros positivos m y n tales que 
/ = mA — nB + e~ x — e~ x A . 


Comprobar esta relacion con los resultados obtenidos. 

23. Un cono se obtiene uniendo todos los puntos de una region plana S con un punto no 
situado en el piano de S. Designando con A el area de S, y con b la altura del cono. 
Demostrar que: 

a) El area de la seccion producida por un piano paralelo a la base y a distancia t del 
vertice es ( t/h) 2 A, si 0 < t < h. 

b) El volumen del cono es \Ah. 

24. Invertir el orden de integracion para deducir la formula 


lo \o emia ~ X)d y = lo ( a ~ x)e" l{a - x) f{x) dx. 


donde a y m son constantes, a > 0. 


11.16 Otras aplicaciones de las integrales dobles 

Ya hemos visto que las integrales dobles pueden usarse para calcular volu- 
menes de solidos y areas de regiones planas. Otros muchos conceptos tales como, 
masas, centros de gravedad y momentos de inercia pueden definirse y calcularse 
con el auxilio de integrales dobles. En esta seccion se exponen brevemente estos 
problemas que tienen especial importancia en fisica e ingenieria. 

Sea P el vector que une el origen con un punto cualquiera de E,,. Si n masas 
positivas m 1( m 2 ,... ,m n estan localizadas en los puntos P lt P 2 ,. .. ,P n respec- 
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tivamente, el centro de gravedad del sistema se define como el punto C determi- 
nado por el vector 


_ 2i r 1 ni k P 

22=1 m k 

El denominador, 2 m i< se llama masa total del sistema. 

Si cada masa m* se traslada segun un vector A a un nuevo punto Q k siendo 
Q k — P k + A, el centro de gravedad tambien experimenta la traslacion A, puesto 
que se tiene 


Z m kQk _ 2 m k (P k + A) = 2 m * p k 

2 m k 2 m k 2 m k 


+ A — C + A. 


Esto tambien se expresa diciendo que la posicion del centro de gravedad depende 
tan solo de los puntos P 1 , P 2 ,..., P n y de las masas, y no de la situation del 
origen. El centro de gravedad es una cantidad calculada teoricamente que repre- 
senta, por asi decirlo, un ficticio «punto de equilibrio» del sistema. 

Si las masas estan en un piano en los puntos de coordenadas (x 1; yO, . .., 
(Xn, y„), y si el centro de gravedad tiene coordenadas (x, y), la relation vectorial 
que define C puede expresarse con dos ecuaciones escalares, 

. _ I m k x k I m k y k 

2 m k 2 m k 


En el numerador del cociente que define x, el termino k-e simo de la suma, mkXk, 
se denomina el momento de la masa m* respecto al eje y. Si una masa m igual a 
la masa total del sistema fuese situada en el centro de gravedad, su momento 
respecto al eje y serfa igual al momento del sistema 


mx =2 m kX k 

k =l 


Cuando nos referimos a un sistema cuya masa total esta distribuida en una 
cierta region del piano en lugar de estar situada en un numero finito de puntos 
aislados, los conceptos de masa, centro de gravedad y momento se definen me- 
diante integrales en lugar de hacerlo con sumas. Por ejemplo, consideremos una 
«fina lamina» que tenga la forma de una region plana S. Supongamos que la ma¬ 
teria esta distribuida por toda la lamina con una densidad conocida (masa por 
unidad de area). Con ello significamos que existe una funcion / no negativa defi- 
nida en S y que f(x, y) representa la masa por unidad de area en el punto (x, y). 
Si la lamina o placa esta construida con un material homogeneo la densidad es 



Otras aplicaciones de las integrates dobles 


457 


constante. En tal caso la masa total de la lamina se define como el producto de 
la densidad por el area de la lamina. 

Cuando la densidad varia de un punto a otro utilizamos la integral doble de 
la densidad como definicion de la masa total. Es decir, si la funcion densidad / 
es integrable en S, definimos la masa total m(S) de la lamina mediante la formula 


El cociente 


m(S) = JJ f(x, y) dx dy. 
s 


masa 

area 


J.f /(*> y) dx dy 
s _ 

JJ dx dy 
s 


se llama densidad media de la lamina. Si consideramos que S no es precisamente 
una lamina delgada, sino una figura geometrica de dos dimensiones, el anterior 
cociente se llama promedio o valor medio de la funcion / sobre la region S. En 
este caso no exigimos que / sea no negativa. 

Por analogfa con el caso finito, definimos el centro de gravedad de la lamina 
como el punto ( x, y) determinado por las formulas 


(11.14) xm(S) = JJ xf(x, y) dx dy y ym(S) = j f yf(x, y) dx dy . 
s s 

Las integrales del segundo miembro son los momentos de la lamina respecto 
a los ejes y y x respectivamente. Cuando la densidad es constante, f(x, y) = c, se 
simplifica las igualdades (11.14) y obtenemos 


xa(S) = J J x dx dy y ya(S) = JJ y dx dy, 
s s 

donde a(S) es el area de S. En este caso el punto (x, y) se denomina el centroide 
de la lamina (o de la region S). 

Si L es una recta en el piano de la lamina y representamos con 8(x, y) la 
distancia desde el punto ( x, y) de S a la recta L, el numero I L definido por 

= JJ d\x, y)f(x, y) dx dy 
s 

se llama momento de inercia de la lamina respecto a L. Si f(x, y) = 1, I L se deno¬ 
mina momento de inercia o segundo momento de la region S respecto a L. Los 
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momentos de inercia respecto a los ejes x e y se designan con I x e I y , respectiva- 
mente, y vienen dados por las integrales 

4 = // //(*» y)dxdy y I„ = jj x 2 /(x, y ) dx dy. 
s s 

La suma de esas dos integrales se llama momento polar de inercia I 0 respecto al 
origen: 


I 0 = I x + I v = JJ (x 2 + y 2 )f(x, y) dx dy. 

s 

Nota. La masa y el centro de gravedad de una lamina tienen propiedades que 
dependen del cuerpo y no de la situacion del origen y de las direcciones de los ejes 
coordenados. El momento polar de inercia depende de la posicion del origen, pero 
no de las direcciones de los ejes. Los momentos y momentos de inercia respecto a 
los ejes x e y dependen de la situacion del origen y de las direcciones de los ejes. 
Si una lamina de densidad constante posee un eje de simetria, su centroide estara 
en dicho eje. Si tiene dos ejes de simetria, el centroide estara en su intersection. 
Estas propiedades pueden demostrarse a partir de las definiciones que preceden, 
y son muy utiles, pues simplifican frecuentemente los calculos. 

ejemplo 1. Una lamina delgada de densidad constante c esta limitada por 
dos circunferencias concentricas de radios a y b y centro en el origen, siendo 
0 < b < a. Calcular el momento polar de inercia. 

Solucion. La integral para calcular J 0 es: 

h = c/J (x 2 + y 2 )dxdy, 
s 

siendo S = {(x, y) \ b 2 ^ x* + y 2 - a 2 }. Para simplificar los calculos tengamos en 
cuenta que la integral es una funcion aditiva en la region de integracion (ya que 
el integrando es no negativo), de modo que tenemos: 

Iq = c // (x 2 + /) dx dy — e j| (x 2 + y 2 ) dx dy, 

S(a) Sib) 

donde S(a ) y S(b) son los discos circulares de radios ay b, respectivamente. Pode- 
mos usar la integracion reiterada para calcular la integral extendida a S(a), y en- 
contramos 


JJ (x: 

S(a) 


+ y 2 ) dx dy = 4 



(x 2 + /) dy 
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(Omitimos los detalles de calculo debido a que esta integral puede calcularse mas 
facilmente en coordenadas polares, lo que se expondra en la seccion 11.27.) Por 
lo tanto, 


, TTC , 4 , 4 , , 2 , 2x (a 2 + b 2 ) a 2 + b 2 

= — (a — b ) = 7 Tc(a — b ) 1 - = m ——— 

2 2 2 


donde m = ^ r c(a 2 — b 2 ) es la masa de la lamina. 

eiemplo 2. Determinar el centroide de la region plana limitada por un 
arco de sinusoide. 

Solution. Consideremos la region S limitada por la curva y = sen x y el 
intervalo 0 ^ x ^ it. Por la simetria, la coordenada x del centroide es x = tt/ 2. 
La coordenada y viene dada por 

JJ >' dx dy JS [ Jr r dy] dx J; \ sen 2 x dx 
_ _ s ___^ 

JJ dx dy JJ sen x dx 2 8 

s 


11.17 Dos teoremas de Pappus 

Pappus de Alejandrfa, que vivio en la segunda mitad del siglo tercero, fue 
uno de los ultimos geometras de la escuela de Alejandria de matematicos griegos. 
Escribio un compendio de ocho libros en los que recogio gran parte de los cono- 
cimientos matematicos de aquel tiempo. (Se conservan los seis ultimos y una parte 
del segundo.) Pappus descubrio numerosas propiedades interesantes de los cen- 
troides, dos de las cuales exponemos en esta seccion. La primera relaciona el 
centroide de una region plana con el volumen del solido de revolucion obtenido 
por la rotacion de la citada region alrededor de una recta de su piano. 

Consideremos una region plana Q situada entre las graficas de dos funciones 
continuas / y g en el intervalo [a, b], siendo 0 - g - f. Sea S el solido de revo- 
lucion engendrado al girar Q alrededor del eje x. Designemos por a(Q) el area 
de Q, v(S) el volumen de S, y con y la coordenada y del centroide de Q. Al girar 
Q para engendrar S, el centroide se desplaza a lo largo de una circunferencia de 
radio y. El teorema de Pappus establece que el volumen de S es igual al producto 
de la longitud de esa circunfarencia multiplicada por el area de Q; esto es. 


( 11 . 15 ) 


v{S) = 2nya(Q). 



460 


Integrates multiples 


Para demostrar esta formula observemos tan solo que el volumen viene dado 
por la integral 


v(S) = TT j b U\x) — g 2 (x)j dx 

J a 


y que y se obtiene con la formula 

ya(Q) = JJ ydydx = £" [ y dy] dx = £ {[f(x) - g 2 (.v)] dx. 

Q 

Comparando esas dos formulas se obtiene inmediatamente (11.15). 

ejemplo 1. Volumen de un toro. Sea S el toro engendrado al girar un 
disco circular Q de radio R alrededor de un eje a una distancia b > jR del cen¬ 
tra de Q. El volumen de S se calcula facilmente con el teorema de Pappus. Tene- 
mos y = b y a(Q ) = irR 2 , as! que 

v(S ) = 2 rrya(Q) = 2rr 2 R 2 b. 

El ejemplo que sigue hace ver que el teorema de Pappus tambien puede usar- 
se para determinar centroides. 

ejemplo 2. Centroide de un disco semicircular. Sea y la coordenada y del 
centroide del disco semicircular 

Q = {(*, y) | x 2 + y 2 <R 2 , y > 0}. 

El area de Q es hrR 2 . Cuando Q gira alrededor del eje x engendra una esfera 
de volumen %-rR 3 . Segun la formula de Pappus tenemos 


4 R 

asi que y = -— 
3tt 


|t rR 3 — l-nyilynK 2 -), 


El teorema de Pappus que sigue establece que el centroide de la reunion de 
dos regiones planas disjuntas A y B esta en el segmento de recta que une el cen¬ 
troide de A con el centroide de B. Con mayor generalidad, sean A y B dos lami- 
nas delgadas que son disjuntas o se cortan en un conjunto de puntos de conte- 
nido nulo. Designemos con m(A) y m(B) sus masas y con C A y C n los vectores 
que unen el origen con los respectivos centros de gravedad. La reunion A <J B 
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tiene entonces masa m(A) + m(B) y su centro de gravedad esta determinado por 
el vector C dado por la formula 


( 11 . 16 ) 


m(A)Cj + m(B)C B 
m(A ) + m(B) 


El cociente que da C es una combinacion lineal de la forma aC A + bC B , en la 
que a y b son escalares no negativos cuya suma es 1. Una combinacion lineal de 
esta forma se llama combinacion convexa de C A yC B . El extremo de C esta situa- 
do en el segmento de recta que une los extremos de C A y C B . 

La formula de Pappus (11.16) se deduce inmediatamente de la definicion de 
centro de gravedad que se da en (11.14). Puede generalizarse de manera sencilla 
a la reunion de tres o mas regiones. Es util especialmente en la practica cuando 
una lamina de densidad constante se compone de varias porciones, cada una de 
las cuales tiene simetria geometrica. Determinamos el centroide de cada portion 
y formamos luego una adecuada combinacion lineal para encontrar el centroide 
de la reunion. En el ejercicio 21 de la section siguiente se dan ejemplos. 


11.18 Ejercicios 


En los ejercicios del 1 al 8 la region S esta limitada por una o mas curvas de las que se 
dan las ecuaciones. En cada caso dibujar la region S y determinar las coordenadas x e y del 
centroide. 


1. y = x 2 , x + y = 2. 

2. y 2 = x + 3, y 2 = 5 - x. 

3. x — 2y + 8 = 0, x + 37 + 5 = 0, x = —2, x = 4. 

4. y = sen 2 x, 7 = 0 , 0 <,x<,ir. 

IT 

5. y = sen x , y = cos x , 0 <, x <, — . 

6 . y =\ogx, 7 = 0 , 1 <x<,a. 

7. yfx + *Jy = 1, x — 0-, j=0. 

8 . x% + y A = 1 , x = 0 , 7 = 0 , en el primer cuadrante. 

9. Una lamina delgada esta limitada por el arco de parabola y = 2x — x 1 y el intervalo 
0 < x < 2. Determinar su masa si la densidad en cada punto (x, y) es (1 — y)/(l + x). 

10. Determinar el centro de gravedad de una lamina delgada rectangular ABCD si la den¬ 
sidad en todos sus puntos es el producto de sus distancias a los lados AB y AD. 

En los ejercicios 11 a 16 calcular los momentos de inercia h e I, de una lamina delgada 
S del piano xy bordeada por una o mas curvas cuyas ecuaciones se citan. En cada caso 
f(x,y) representa la densidad de un punto cualquiera ( x,y ) de S. 

11 . 7 = sen* x, y = -sen 2 *, -w <, x <, n ; f(x,y) = 1 . 
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12 . — + t = 1 . -+I = 1. y= 0, 0 < c < a, b> 0; f(x,y) = l. 

a D CD 

13. (x-r) 2 + (y -rf = r 2 , x=0, y= 0, 0 £ * £ r,0 ^ y <, r ;f(x,y) - 1 . 

14. atj = 1, xj=2, *=2j, y=2x, x> 0, y > 0 ; f{x,y) = 1. 

15. y=e*, y = 0, f(x,y)=xy. 

16. y = yflx, y = 0, 0^x^2; fix, y) = \x - y\ . 

17. Sean S una lamina delgada de masa m, y L a y L dos rectas paralelas en el piano de S, 
pasando Lo por el centro de gravedad de S. Demostrar el teorema de los ejes paralelos: 

4 = 4 0 + wA 2 , 

donde h es la distancia entre las dos rectas L 0 y L. [Indicacion . El trabajo se simplificara 
con una adecuada eleccion de los ejes coordenados.] 

18. El contorno de una lamina delgada es una elipse de semiejes a y b. L representa una 
recta en el piano de la lamina que pasa por el centro de la elipse y forma un angulo a 
con el eje de longitud 2a. Si la densidad es constante y la masa m, demostrar que el 
momento de inercia I L es igual a \m(a 2 sen 2 a + b 2 cos 2 a). 

19. Encontrar la distancia media desde un vertice de un cuadrado de lado h a los puntos 
interiores del mismo. 

20. Sea S la distancia desde un punto arbitrario P interior a un circulo de radio r a un punto 
fijo Po cuya distancia al centro del circulo es h. Calcular el valor medio de la funcion 
S 2 en la region limitada por el circulo. 

21. Sean A, B, C los siguientes rectangulos del piano xy: 

A = [0,4] x [0, 1], B = [2,3] x [1,3], C=[2,4] x [3,4]. 

Aplicar el teorema de Pappus para determinar el centroide de las siguientes figuras: 

a) /iui. c) fluC. 

b ) A u C. d)/luSuC. 

22. Un triangulo isosceles T tiene base 1 y altura h. La base de T coincide con uno de los 
lados de un rectangulo R de base 1 y altura 2. Encontrar el valor de h de manera que 
el centroide de R T este situado en el lado comun de R y T. 

23. Un triangulo isosceles T tiene base 2 r y altura r. La base de T coincide con el lado 
recto de un disco semicircular D de radio r. Determinar la relacion que debe existir 
entre r y h para que el centroide de T u D este situado en el interior del triangulo. 


11.19 Teorema de Green en el piano 

El segundo teorema fundamental* del calculo para las integrales de lrnea es- 
tablece que la integral de.linea de un gradiente V/ a lo largo de un camino que 
une dos puntos ay b puede expresarse en funcion de los valores /(«) y f(b). Exis- 
te un teorema analogo en dos dimensiones que expresa una integral doble exten- 
dida a una region R como una integral de linea a lo largo de la curva cerrada 
que constituye la frontera de R. Este teorema corrientemente se denomina teorema 
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de Green, (*) pero a veces se llama teorema de Gauss. Puede establecerse de va- 
rias maneras; la mas frecuente es en la forma de la identidad: 


(11.17) jj - j\ dx dy = <j)P dx + Qdy. 

R 

La curva C que aparece en el segundo miembro es el contomo de la region R, y 
el simbolo de integracion indica que la curva se recorre en el sentido contrario 
al de las agujas del reloj, como se ve en la figura 11.13. 



Figura 11.13 La curva C es la frontera de R, recorrida en el sentido contrario al de las 

agujas del reloj. 

Se precisan dos tipos de hipotesis para la validez de la identidad. Primero, se 
imponen condiciones a P y Q a fin de asegurar la existencia de las integrales. Las co- 
rrientes son que P y Q sean derivables con continuidad en un conjunto abierto S 
que contenga la region R. Esto implica la continuidad de P y Q sobre C asi como la 
continuidad de dP/dy y dQ/dx en R, aunque el teorema tambien es cierto con 
hipotesis menos restrictivas. Segundo, hay otras condiciones de tipo geometrico 
que se imponen a la region R y a su contorno C. La curva C puede ser cualquier 
curva cerrada simple rectificable. La palabra «rectificable» significa, natural- 
mente, que C tiene una longitud finita. A fin de explicar lo que se entiende por 
curva cerrada simple, nos referiremos a la funcion vectorial que describe la curva. 

(*)_ En honor a George Green (1793-1841), matematico ingles que estudid las aplicaciones 
matematicas a la electricidad y magnetismo, flujo de fluidos, y a la reflexidn y refraccion de la 
luz y del sonido. El teorema que lleva el nombre de Green aparece ya en las investigaciones 
de Gauss y de Lagrange. 


464 


Integrates multiples 


Supongamos que C viene descrita por una funcion vectorial continua a defi- 
nida en un intervalo [ a,b ]. Si a (a) =a (b), la curva es cerrada. Una curva cerrada 
tal que a(/,)#a(t 2 ) para todo par de valores t, #4 del intervalo semiabierto 
( a, b ] se llama curva cerrada simple. Esto significa que, excepto para los extre- 
mos del intervalo [a, b], valores distintos de t originan puntos distintos de la 
curva. La circunferencia es el tlpico ejemplo de curva cerrada simple. 

Las curvas cerradas simples planas se llaman corrientemente curvas de Jordan 
en recuerdo de Camilo Jordan (1838-1922), famoso matematico frances que fue 
de los primeros que trabajo sobre los conceptos de curvas cerradas simples y de 
longitud de arco. Toda curva de Jordan C descompone el piano en dos conjuntos 
abiertos conexos y disjuntos que tienen la curva C como frontera comun. Una de 
esas regiones es acotada y se llama interior a C. (Vease la region sombreada en 
la figura 11.13.) La otra es no acotada y se llama exterior a C. Para ciertas curvas 
de Jordan familiares como circunferencias, elipses, o poligonos elementales, es 
intuitivamente evidente que la curva divide al piano en una region interior y otra 
exterior, pero demostrai que es esto cierto para una curva de Jordan cualquiera 
no es cosa facil. Jordan fue el primero en precisar que esa afirmacion requeria 
demostracion; el resultado se conoce por el nombre de teorema de la curva de 
Jordan. Hacia fines del siglo xix Jordan y otros publicaron demostraciones incom- 
pletas. En 1905 el matematico americano Oswald Veblen (1880-1960) dio la pri- 
mera demostracion completa del teorema. El teorema de Green es valido siempre 
que C es una curva rectificable de Jordan, y la region R es la reunion de C y de 
la region interior a ella. (*) Puesto que no hemos definido las integrales de Knea 
a lo largo de curvas rectificables cualesquiera, limitamos nuestra discusion a cur¬ 
vas regulares a trozos. 

Existe otra dificultad tecnica asociada a la formulacion del teorema de Green. 
Ya hemos observado que, para la validez de la identidad (11.17), la curva C debe 
ser recorrida en sentido contrario al de las agujas del reloj. Intuitivamente, esto 
significa que un hombre que vaya andando a lo largo de C tiene siempre la re¬ 
gion R a su izquierda. Tambien, para algunas curvas de Jordan corrientes, como 
las antes mencionadas, el significado de la expresion «recorrer una curva en sen¬ 
tido contrario al de las agujas del reloj» es intuitivamente evidente. No obstante, 
en una demostracion estrictamente rigurosa del teorema de Green se deberia defi- 
nir esta expresion en terminos completamente anah'ticos, esto es, mediante la 
funcion vectorial a que describe la curva. En la section 11.24 se esboza una posi- 
ble definition. 

Habiendo ya senalado algunas de las dificultades asociadas a la formulacion 
del teorema de Green, lo enunciaremos en una forma mas bien general e indica- 
remos brevemente por que es valido para ciertas regiones. En esta discusion el 


(*) En el capitulo 10 de la obra del autor Analisis matematico, se puede ver una de¬ 
mostracion del teorema de Green para regiones de tal generalidad. 
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significado de «contrario al de las agujas del reloj» es intuitiva, de manera que 
la demostracion no es completamente rigurosa. 

TEOREMA 11.10. TEOREMA DE GREEN PARA REGIONES PLANAS LIMITADAS 
por curvas de Jordan regulares A trozos. Sean P y Q campos escalares deri- 
vables con continuidad en un conjunto abierto S del piano xy. Sea C una curva 
de Jordan regular a trozos, y representemos por R la reunion de C y de su inte¬ 
rior. Supongamos que R esta contenida en S. Se tiene entonces la identidad 

(1U8) = + 

R 

en la que la integral de llnea se toma alrededor de C en sentido contrario al de 
las agujas del reloj. 

Nota. La identidad (11.18) es equivalente a las dos formulas 


(11.19) 


j dx dy = -<j) Q dy 


y 


( 11 . 20 ) 



n 


En efecto, si estas dos formulas son validas, sumando se deduce (11.18). Reciproca- 
mente, si (11.18) es cierta podemos obtener (11.19) y (11.20) como caso particular 
tomando P = 0 y Q = 0, respectivamente. 


Demostracion para regiones especiales. Demostraremos (11.20) para una 
region R del tipo I. Una tal region tiene la forma 

4 

R — ((.v, r) | a < ,v < b y f(x) < r < g(.v)}, 

en donde / y g son continuas en [a, b ] siendo / ^ g. La frontera C de R consta 
de cuatro partes, un arco inferior C x (grafica de /), otro superior C 2 (grafica de 
g), y dos segmentos rectilfneos verticales, recorridos en el sentido indicado en la 
figura 11.14. 
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Figura 11.14 Demostracion del teorema de Figura 11.15 Demostracion del teorema de 
Green para una region especial. Green para una region mas general. 

Calculemos primero la integral doble — / / (dP/dy) dx dy por integration 
sucesiva. Integrando primero respecto a y tenemos 



= | b P[x,f(x)] dx - P P[x, g(x)] dx. 

» a da 


Por otra parte, la integral de linea f c P dx puede escribirse asi 

j c Pdx = j Ci Pdx + j c /dx, 

puesto que la integral de linea a lo largo de cada segmento vertical es cero. 
Para calcular la integral a lo largo de C ± utilizamos la representacion vectorial 
oc(t) = ti + f(t)j y obtenemos 

L Pdx= f" P[t,f(t)]dt. 

* L i da 

Para calcular la integral a lo largo de C 2 emplearemos la representacion a(t) = 
ti + g(t)j y tendremos en cuenta la inversion del sentido para obtener 

b PdX= -l b a P[t ’ S(t)]dt - 

Tenemos por lo tanto 

S c p dx = IS p [ ? -/(0] dt - IS p[t, g(t)] dt. 
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Comparando esta formula con la (11.21) obtenemos (11.20). 

Un razonamienlo parecido puede emplearse para demostrar (11.19) para re- 
giones del tipo II. Se obtiene de este modo una demostracion del teorema de 
Green para regiones que son a un tiempo del tipo I y del tipo II. Hecho esto, 
puede demostrarse el teorema para regiones R que pueden descomponerse en un 
numero finito de regiones que son de ambos tipos. Se introducen «secciones» o 
«cortes» como se ve en la figura 11.15, se aplica el teorema a cada subregion, y 
se suman los resultados. Las integrales a lo largo de los cortes se reducen a pa¬ 
res, como se sugiere en la figura, y la suma de las integrales de linea a lo largo 
de las fronteras de las subregiones es igual a la integral de linea a lo largo de 
la frontera de R. 

11.20 Algunas aplicaciones del teorema de Green 

Los ejemplos que siguen muestran algunas aplicaciones del teorema de Green. 

ejemplo 1. Por medio del teorema de Green calcular el trabajo efectuado 
por el campo de fuerza f(x, y) — (y + 3 x)i + (2y — x)j al mover una particula 
rodeando una vez la elipse 4x 2 + y 2 = 4 en el sentido contrario al de las agujas 
del reloj. 

Solucidn. El trabajo es igual f c P dx+Q dy, donde P— y + 3x, Q = 2y—x, 
y C es la elipse. Ya que dQ/dx — dP/dy = — 2, el teorema de Green nos da 

J f . P dx + Q dy = j J (-2) dx dy = -2 a(R), 

R 

donde a(R) es el area interior a la elipse. Ya que esta elipse tiene semiejes 
a = 1 y b = 2, su area es irab = 2ir y el valor de la integral de linea es — 4 t r, 

ejemplo 2. Calcular la integral / c (5 — xy — y 2 )dx — (2xy — x 2 )dy, donde 
C es el cuadrado de vertices (0, 0), (1, 0), (1, 1), (0, 1). 

Solucidn. Aqui P = 5 — xy — y 2 , Q — x 2 — 2xy, y dQ/dx — dP/dy = 3x. 
Luego, segun el teorema de Green, tenemos, 

j" P dx + Q dy = 3 j | x dx dy = 3.v, 

K 

donde x es la coordenada x del centroide del cuadrado. Puesto que x=y 2 , el 
valor de la integral de linea es %. 

ejemplo 3. El area expresada como una integral ae linea. La integral do- 
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ble que da el area a(R) de una region R puede expresarse en la forma 

R R J 

en donde P y Q son tales que 3Q/3x — dP/dy = 1. Por ejemplo, podemos tomar 
Q(x, y) = V 2 X y P(x, y) = — l /oy. Si R es la region encerrada en una curva de 
Jordan C podemos aplicar el teorema de Green para expresar a(R) como integral 
de linea 


a(R) 


= 1 


P dx + Q dy 


-if - 

2 Jc 


y dx + x dy. 


Si la curva frontera C esta dada parametricamente 

x = X(t), y—Y{t), a<t<b, 

la integral de linea que da el area toma la forma 
a(R) = i f {-Y(t)X'(t) + X(t)Y'(t)} d 

Z Ja 


1 p 

X(t) 

no 

2 Ja 

X'(t) 

no 


dt. 


11.21 Condicion necesaria y suficiente para que un catnpo vectorial bi-dimen- 
sional sea un gradiente 

Sea fix, v) = P(x,y)i + Q(x,y)j un campo vectorial derivable con conti- 
nuidad en un conjunto abierto S del piano. Si / es un gradiente en S tenemos 

(11 2 1 ) — = — 

dy dx 

en todo S. Es decir, la condicion (11.22) es necesaria para que / sea un gra¬ 
diente. Como va hemos observado, esta condicion no es suficiente. Por ejemplo, 
el campo vectorial 


Ax, y) 


-y 

x 2 + y 2 


i + 


x 

x 2 + y 2 


i 


satisface (11.22) en todo el conjunto S = R 2 — {(0, 0)}, pero / no es un gradiente 
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en S. En el teorema 10.9 se demostro que la condicion (11.22) es a la vez nece- 
saria y suficiente para que / sea un gradiente en S si el conjunto S es convexo. 
Con la ayuda del teorema de Green podemos extender este resultado a una clase 
mas general de conjuntos pianos como los conjuntos simplemente conexos. Estos 
se definen como sigue. 

DEFINICION DE CONJUNTO PLANO SIMPLEMENTE CONEXO. Sea S Un COnjuntC 
piano abierto y conexo. Se dice que S es simplemente conexo si, para toda curva 
de Jordan C situada en S, la region interior a S es tambien un subconjunto de S. 

Un anillo (conjunto de puntos situados entre dos circunferencias concen- 
tricas) no es simplemente conexo debido a que toda la region interior a la cir- 
cunferencia externa no es un subconjunto del anillo. Dicho en forma intuitiva, un 
conjunto S es simplemente conexo cuando no tiene «agujeros». Otro modo de 
describir la conexion simple consiste en decir que una curva C t de S que une 
dos puntos cualesquiera puede ser transformada sin ruptura en otra curva C 2 de S 
que une aquellos dos puntos, con la particularidad de que todas las curvas inter- 
medias obtenidas en la deformacion estan contenidas en S. Otra definicion que 
es equivalente a la dada, segun puede demostrarse, dice que un conjunto es sim¬ 
plemente conexo si su complementario (respecto a todo el piano) no es conexo. 
Por ejemplo, un anillo no es simplemente conexo porque su complemento es no 
conexo. Un conjunto abierto y conexo que no es simplemente conexo se llama 
multiplemente conexo. 

teorema 11.11. Si f(x,y) = P(x,y)i + Q(x,y)j es un campo vectorial deri¬ 
vable con continuidad en un conjunto abierto simplemente conexo S del piano, 
entonces f es un gradiente en S si y solo si tenemos 

(11.23) tiP _dQ en t 0 d os fas puntos de S. 

dy dx 

Demostracion. Ya hemos dicho que la condicion (11.23) es necesaria para 
que / sea un gradiente. Demostraremos ahora que tambien es suficiente. 

Puede demostrarse que en cualquier conjunto piano conexo y abierto S, todo 
par de puntos a y x puede unirse mediante un poligono escalonado simple, esto 
es, mediante un poligono cuyos lados son paralelos a los ejes coordenados y que 
no se cortan a si mismos. Si la integral de linea de / desde a hasta x tiene el 
mismo valor para todo poligono escalonado simple en S que una a con x, enton¬ 
ces el mismo razonamiento empleado para demostrar el teorema 10.4 prueba que 
/es un gradiente en S. Por consiguiente, necesitamos tan solo comprobar que 
la integral de linea de / desde a hasta x tiene el mismo valor para todo poligono 
escalonado simple en S que una a con x. 

Sean C, y C 2 dos poligonos escalonados simples en S que unan a y x. Algu- 
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Figura 11.16 Independence del camino en una region simplemente conexa 


nas porciones de estos poh'gonos pueden coincidir. Las restantes porciones se cor- 
taran a lo sumo un numero finito de veces, y formaran las fronteras de un numero 
fmito de regiones poligonales, R lt , R m . Puesto que se supone que S es sim¬ 
plemente conexo, cada una de las regiones Rk es un subconjunto de S. En la figu¬ 
ra 11.16 se ha dibujado un ejemplo. La poligonal de trazo continuo representa C 1 
y la de puntos C 2 , las regiones sombreadas son las R lt ..., R m . (A lo largo del 
segmento pq esas dos poligonales coinciden.) 

Observemos ahora que la integral de linea de / a lo largo de C, desde a 
hasta x mas la integral de x hasta a a lo largo de C 2 es cero ya que la integral 
a lo largo del camino cerrado es una suma de integrales tomadas sobre los seg- 
mentos comunes a Cj y C 2 mas las integrales tomadas a lo largo de las fronteras 
de las regiones Rk- Las calculadas sobre los segmentos comunes se anulan a pares, 
ya que cada uno de tales segmentos se recorre dos veces, en sentidos opuestos, y 
su suma es cero. La integral sobre la frontera r* de cada region Rk tambien es 
cero porque, en virtud del teorema de Green, podemos escribir 

r* R t 

y el integrando de la integral doble es cero en virtud de la hipdtesis dQ/dx = dP/dy 
Se deduce que la integral de a a x a lo largo de Cj es igual a la calculada a lo 
largo de C 2 . Como hemos observado antes, esto implica que / es un gradiente 
en S. 
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11.22 Ejercicios 

1 . Usar el teorema de Green para calcular la integral <j> c y 2 dx + x dy cuando 

a) C es el cuadrado de vertices (0,0), (2,0), (2,2), (0,2). 

b) C es el cuadrado de vertices (± 1, ±1). 

c) C es el cuadrado de vertices (— 2,0), (0, — 2). 

d) C es la circunferencia de radio 2 y centro en el origen. 

e) C tiene la ecuacion vectorial <*(/) = 2 cos 3 t i + 2 sen t j, 0 <, t <, 2 rr. 

2. Si P(x,y) = xe~ yl y Q(x,y) = -x 2 ye~ v * + l/(x 2 + y 2 ) calcular la integral j>Pdx + 
Q dy siguiendo el contorno del cuadrado de lado 2 a deferminado por las desigualdades 
1*1 ^ a y |y| <, a. 

3. Sea C una curva cerrada simple del piano xy y representemos con I t el momento de 
inercia (alrededor del eje z) de la region interior a C. Demostrar que existe un entero n 
tal que 

nl z = ■j> c x 3 dy — y 3 dx. 

4. Dados dos campos escalares u y v derivables con continuidad en un conjunto abierto 
que contiene el disco R cuya frontera es la circunferencia x 2 + y 2 = 1. Definimos dos cam¬ 
pos vectoriales / y g como sigue: 

/ du Su\ (dv Sv\ 

f(x,y) = v(x,y)i + u(x,y)j, g(x,y) = - -J/ + --jj. 

Encontrar el valor de la integral doble \\ f - g dx dy si se sabe que sobre la frontera 
de R se tiene u(x,y) = 1 y v(x,y) = y. n 

5. Si / y g son derivables con continuidad en un conjunto abierto conexo S del piano, 

demostrar que fVg ■ da = —^> c gVf- da para toda curva de Jordan C regular a 

trozos contenida en S. 

6. Sean u y v dos campos escalares con derivadas parciales primeras y segundas con- 
tinuas en un conjunto abierto conexo S del piano. Sea R una region de S limitada por 
una curva de Jordan C regular a trozos. Demostrar que 

a) jm, dx + uv dy — - |) + - |) j dx dy. 

R 


R 


d 2 v d 2 u \ 

— v ——— I dx dy. 


Derivadas normales. En la seccion 10.7 definimos las integrales de lfnea respecto a la 
longitud del arco de tal modo que es valida la siguiente igualdad: 


\c Pdx +Qdy = j c f- Tds. 
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donde / = Pi + QJ y t es el vector unitario tangente a C. (El producto interior f ■ T se 
llama componente tangencial de / a lo largo de C.) Si C es una curva de Jordan representada 
por una funcion derivable con continuidad o (t) = X(t)i + Y(t)j, el vector normal exterior 
unitario n a C se define por 


n(t) = 


K(OII 


( Y'(t)i - X'(t)j) 


donde ||a'(?)|| ^ 0. Si <p es un campo escalar con un gradiente \ f en C, la derivada normal 
dtp/dn se define en C mediante la ecuacion 

da> 

—— = V(p ■ n. 
on 

Esto es, naturalmente, la derivada direccional de <p en la direccion de n. En los ejercicios res- 
tantes de esta seccion se tratan estos conceptos. 

7. Si / = Qi — Pj , demostrar que 

j c pdx + Qfy = j c f rids. 

(El producto f ■ n se llama componente normal de / a lo largo de C.) 

8. Sean / y g dos campos escalares con derivadas parciales segundas y primeras continuas 
en un conjunto abierto S del piano. Representemos con R una region (en S) cuya fron- 
tera es una curva de Jordan C regular a trozos. Demostrar las identidades siguientes, 
donde V 2 « = d 2 u / 3x 2 + 3 2 «/ dy 2 . 

a) 


Y n ds = jj^gdxdy- 

R 

b) j , c f *i ds = JJ {fV2g + Vf ' V S)dxdy. 

R 

c) !(/! -<■!) * - JJ -snxi**?- 

R 

La identidad c) se llama formula de Green; ella demuestra que 


l'h-i 


ffjs = g*lds 


donde / y g son armonicas en R (esto es, cuando V ! / = V 2 g = 0 en R). 
9. Supongamos que la ecuacion diferencial 


P(x, y) dx + Q(x, y) dy = 0 

tiene un factor integrante n(x,y) que nos permite obtener una familia simplemente infinita 
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de soluciones de la forma <p(x,y) = C. Si la pendiente de la curva <p(x, y) = C en (x,y) 
es tan d, el vector unitario normal n se expresa 

n = sen 6 i — cos Oj. 

Existe un campo escalar g(x, y) tal que la derivada normal de <p viene dada por la formula 

3 <p 

to = Kx,y)g(x,y), 

donde d<p/dn = Vf"- Hallar una formula explfcita para g{x, y) en funcion de P(x,y) 
y Q(x,y). 


* 11.23 Teorema de Green para regiones multiplemente conexas 

El teorema de Green puede generalizarse y ser aplicado a ciertas regiones 
multiplemente conexas. 

TEOREMA 11.12. TEOREMA DE GREEN PARA REGIONES MULTIPLEMENTE CO¬ 
NEXAS. Sean C lt ...,C n n curvas de Jordan regulares a trozos que tienen las 
propiedades siguientes: 

a) Dos cualesquiera de esas curvas no se cortan. 

b) Todas las curvas C 2 , ■.., C„ estan situadas en el interior de C,. 

c) La curva Ci esta en el interior de la curva C, para cada i ^ j, i> 1, j > 1. 
Designemos con R la region que consiste en la reunion de C, con la porcion del 
interior de C 1 que no esta dentro de cualquiera de las curvas C 2 , C 3 , ■ ■ ■, C n 
{En la figura 11.17 esta representada una de tales regiones.) Sean P y Q derivables 
con continuidad en un conjunto abierto S que contiene R. Tenemos entonces la 
siguiente identidad: 

(11.24) If dxdy = ■£ (Pdx + Qdy)-i -SiPdx + Qdy). 

*'•' Vox oyj J Ci k =2 * >c t 

R 

El teorema puede demostrarse introduciendo cortes que transformen R en 
una reunion de un numero finito de regiones simplemente conexas bordeadas por 
curvas de Jordan. El teorema de Green se aplica separadamente a cada una de las 
partes, y se suman luego los resultados. Comentaremos el caso n = 2. Por indue- 
cion se demuestra para un numero n cualquiera de curvas. 

La idea de la demostracion cuando n = 2 se ilustra con el ejemplo de la figura 
11.18, donde Ci y C 2 son dos circunferencias, siendo C x la mayor. Practicamos los 
cortes AB y CD, como se ve en la figura. Sea Ki la curva de Jordan consistente en 
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• Figura 11.18 Demostraeion del teorema de 
Green para una region mulliplemente conexa. 


las mitades superiores de C x y C 2 , y los dos segmentos AB y CD. Llamemos K 2 
otra curva de Jordan formada por las mitades inferiores de C x y C 2 , y los dos 
segmentos AB y CD. Aplicamos el teorema de Green a cada una de las regiones 
limitadas por y K 2 y sumamos las dos identidades asf obtenidas. En la suma 
las integrales calculadas a lo largo de los cortes se anulan unas con otras (pues 
cada corte es recorrido una vez en cada direccion), y se obtiene 

JJ (p - yj dx dy = -£(P dx + Q dy) - j)JP dx + Q dy). 
r ^ x dy Cl 

El signo menos aparece debido a la direccion con que se recorre C 2 . Esta es la 
ecuacion (11.24) cuando n — 2. 

Para una region simplemente conexa, la condicion dP/dy — dQ/dx implica que 
la integral de llnea f P dx + Q dy es independiente del camino (teorema 11.11). 
Como ya hemos observado, si S no es simplemente conexo, la condicion dP/dy = 
— dQ/dx no implica necesariamente la independencia del camino. No obstante, 
para este caso existe una condicion de independencia que se deduce del teore¬ 
ma 11.12. 

TEOREMA 11.13. INVARIANCIA DE UNA INTEGRAL DE LINEA AL DEFORMAR EL 
camino. Sean P y Q derivables con continuidad en un conjunto abierto conexo S 
del piano, y supongamos que dP/dy — dQ/dx en todo S. Sean C, y C 2 dos cur- 
vas de Jordan regulares a trozos situadas en S y que satisfagan las siguientes con- 
diciones: 

a) C 2 esta en el interior de C x . 
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b) Los puntos interiores a que son exteriores a C 2 pertenecen a S. ( En la 
figura 11.19 se ve un ejemplo.) Tenemos entonces 

(11.25) <f> P dx + Q dy = <j> P dx + Q dy, 

•'Cj J C 2 

recorriendose ambas curvas en el mismo sentido. 

Demostracidn. En las condiciones establecidas.la ecuacion (11.24) es aplica- 
ble cuando n = 2. La region R esta constituida por los puntos situados entre las 
dos curvas C 2 y C 2 y las propias curvas. Puesto que dP/dy = dQ/dx en S, el pri¬ 
mer miembro de (11.24) es cero y obtenemos (11.25). 

Algunas veces el teorema 11.13 se expresa diciendo que si dP/dy = dQ/dx 



Figura 11.19 Invariancia de una integral de linea al deformar el camino. 


en S el valor de una integral de linea a io largo de una curva cerrada simple en 
S no varfa si el camino se cambia por deformacion en otra curva cerrada simple 
cualquiera de S, con tal que todas las curvas intermedias que se van obteniendo 
en la deformacion permanezcan dentro de S. Se supone que el conjunto S es 
conexo y abierto — no es preciso que sea simplemente conexo. 

* 11.24 El numero de giros 

Hemos visto que el valor de una integral de linea depende frecuentemente a 
la vez de la curva a lo largo de la cual se integra y del sentido en el que dicha 
curva se recorre. Por ejemplo, la identidad del teorema de Green exige que la 
integral se tome en el sentido contrario al de las agujas del reloj. En un estudio ri- 
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guroso del teorema de Green serfa necesario describir analiticamente lo que 
significa recorrer una curva cerrada en el sentido «contrario al de las agujas 
del reloj». Para ciertas curvas puede hacerse esto estableciendo convenios particu¬ 
lars relativos a la funcion vectorial o que describe la curva. Por ejemplo, la 
funcion vectorial a definida en el intervalo [0, 2n] por la ecuacion 

(11.26) a (t) = (a cos t + x 0 )i + (a sen t -h y 0 )j 

describe una circunferencia de radio a y centro en (x 0 , y 0 ). Se dice que esta fun- 
cidn describe la circunferencia en sentido positivo o contrario al de las agujas 
del reloj. Por otra parte, si reemplazamos t por —t en el segundo miembro de 

(11.26) obtenemos una nueva funcion de la que se dice que describe la circun¬ 
ferencia en sentido negativo o de las agujas del reloj. De este modo hemos dado 
una description completamente analftica del sentido para una circunferencia. 
Sin embargo, no es tan sencillo hacer lo mismo con una curva cerrada cual- 
quiera. Para curvas regulares a trozos puede hacerse introduciendo el concepto 
del numero de giros, un instrumento analftico que nos da un metodo matema- 
ticamente preciso para contar el numero de veces que el radio vector a «gira alre- 
dedor» de un punto dado cuando va describiendo una curva cerrada dada. En 
esta section describiremos brevemente un metodo para introducir el numero de 
giros. Luego indicaremos cdmo puede usarse para asignar sentidos positivos y 
negativos a las curvas cerradas. 

Sea C una curva cerrada del piano regular a trozos, descrita por una fun¬ 
cion vectorial o definida en un intervalo [a, 6], por ejemplo 

a(0 = X(t)i + Y(t)j si a <, t < b. 

Sea P 0 = (xo, yo) un punto no situado en la curva C. El numero de giros de a 
con respecto al punto P 0 se designa por W (a; P 0 ); se define como el valor de le 
siguiente integral 

(11.27) W(a; P„) = — f" ~ [E(0 - yg\X'{t) 

2rrJ a [X(t) - x 0 f + [7(0 - y 0 f 

Esto es lo mismo que la integral de lfnea 

(11.28) 1 -(>• ~ Jo) dx + (x - x 0 ) dy 

2tt Jc (x - x 0 f + (y - y 0 f 

Puede demostrarse que el valor de esta integral siempre es un entero, positivo, 
negativo o nulo. Ademas, si C es una curva de Jordan (curva cerrada simple) ese 
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entero es 0 si P„ es exterior a C y vale +1 6 — 1 si P„ es interior a C. (Ver 
figura 11.20.) Asimismo, W(a; P„) es +1 6 -1 para todo punto P„ interior a C. 



Numero de giros + 1 


Numero de giros — 1 


Numero de giros 0 


Figura 11.20 Posibles valores del numero de giros de una curva de Jordan C 
con respecto al punto l\. 


Esto nos permite definir las orientaciones positiva y negativa para C del siguiente 
modo: Si el numero de giros W(a; P«) es +1 para todo punto P„ interior a C 
decimos que a describe C en sentido positivo o contrario al de las agujas del 
reloj. Si el numero de giros es — 1 decimos que a describe C en sentido negativo 
o de las agujas del reloj. [En el ejemplo 2 de la seccion 10.16, ya se vio un 
ejemplo de la integral (11.28).] 

Para probar que la integral que da el numero de giros es siempre +16—1 
para una curva cerrada simple alrededor de (x 0 , y 0 )> utilizamos el teorema 11.13. 
Designemos con S la region conexa abierta constituida por todos los puntos del 
piano excepto (x„, y ; ,). La integral de linea (11.28) puede entonces escribirse en 
la forma / c Pdx + Qdy, y se comprueba facilmente que dP/dy = dQ/dx en toda 
la region S. Por consiguiente, si (*<,,y 0 ) es interior a C, el teorema 11.13 nos dice 
que podemos reemplazar la curva C por una circunferencia con centra en ( x 0 , y 0 ) 
sin que cambie el valor de la integral. Comprobamos seguidamente que para una 
circunferencia la integral que da el numero de giros es +1 6 — 1, segun que la 
circunferencia este orientada positiva o negativamente. Para una circunferencia 
orientada positivamente podemos utilizar la representacion de la ecuacion (11.26). 
En tal caso tenemos 

X(t) — a cos t + x 0 , Y(t) — a sen t + y 0 , 
y el integrando de (11.27) es identicamente igual a 1. Por tanto obtenemos 

i r 

W(ar,P 0 ) = ^-\ ldt = l. 

27 T JO 

Mediante un razonamiento analogo encontramos que la integral es — 1 cuando C 
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esta orientada negativamente. Esto demuestra que el numero de giros es +1 6 
— 1 para una curva cerrada simple que incluye en su interior el punto (x 0 ,y 0 ). 

* 11.25 Ejercicios 

1. Sean S = {(*, y) | x 2 + y 2 > 0}, y 

p(x ’ y) = ^+7 ’ Q(X ’ y) * 

si (x,y) 6 S. Sea C una curva de Jordan regular a trozos contenida en S. 

a) Si (0,0) es interior a C, demostrar que la integral de linea l c Pdx + Q dy toma el 
valor ± 2w, y razonar cuando el signo es mas. 

b) Calcular el valor de la integral j c Pdx + Q dy cuando (0,0) es exterior a C. 

2. Si r = xi + yj y r = ||r|| , sea 


2si>,._iaos£), 

dy s x 

para r>0. Sea C una curva de Jordan regular a trozos situada en el anillo 1 <x 2 +y 2 <25. 
Hallar todos los valores posibles de la integral de linea de / a lo largo de C. 

3. Una region plana conexa con un solo «agujero» se llama doblemente conexa. (El anillo 
1 < x 1 + y 2 < 2 es un ejemplo.) Si P y Q son derivables con continuidad en una region 
abierta R doblemente conexa, y si dP/dy = dQ/dx en todo R. (.Cuantos valores distintos 
posibles existen para las integrates \ (<P dx + Q dy tomadas sobre curvas de Jordan regu¬ 
lars a trozos situadas en R? 




Figura 11.21 Ejercicio 5 


Figura 11.22 Ejercicio 6 



Cambio de variables en una integral doble 


479 


4. Resolver el ejercicio 3 para regiones triplemente conexas, esto es, para regiones planas 
con dos agujeros solamente. 

5. Sean P y Q dos campos escalares con derivadas continuas que satisfacen dP/ dy = 3 Ql dx 
en todo el piano excepto en tres puntos. Sean C,, C 2 , Cj tres circulos, como muestra la 


figura 11.21, y sea l k = P dx + Q dy. Supongamos que h = 12, h = 10, h - 15. 
Jc k i 

a) Hallar el valor de ! C P dx + Q dy, siendo C la curva en forma de ocho. 

b) Dibujar otra curva cerrada r a lo largo de la cual f P dx + Q dy = 1. Indicar en 
el dibujo el sentido en el que se recorre el camino. 

c) Si /, = 12, h = 9, e h- 15, demostrar que no existe camino cerrado alguno r 
a Id largo del cual / P dx + Q dy = 1. 


6 . Sea h = P dx 4 - Q dy, donde 


c k 

P(x,y) = -y 


1 


+ 


+ 


(x - l) 2 + y 2 x 2 +y 2 (x + 1 ) 2 +y 2 


y 


^ X — 1 X x + 1 

Q(x,y) = (x - l) 2 +/ + X 2 4 -y 2 + (x + l) 2 +/ • 


En la figura 11.22, C, es la circunferencia menor, x 2 + y 2 = i (con el sentido contrario al 
de las agujas del reloj), C 2 es la circunferencia mayor, x 2 + y 2 = 4 (sentido contrario 
al de las agujas del reloj), y C, es la curva reunion de las tres circunferencias 
( x _ 1)2 4 . yi — i > x 2 + y 2 = y (x + l) 2 + y 2 = l dibujadas en los sentidos que se 
indican en la figura. Si h = 6 ir e h = 2 ir, hallar el valor de I t . 


11.26 Cambio de variables en una integral doble 

En la teorfa de integracion unidimensional el metodo de sustitucion nos 
permite calcular integrales complicadas transformandolas en otras mas sencillas 
o en tipos que pueden calcularse mas facilmente. El metodo se basa en la formula 

(11.29) J o 7W dx = J c 7[g(0]g'(0 dt , 

donde a = g(c) y b = g(d). En el volumen I se demostrd esta formula suponiendo 
que g tiene derivadas continuas en [c, d] y que f es continua en el conjunto de 
valores que toma g(f) al variar t en el intervalo [c, d], 

En dos dimensiones existe analogo problema para las integrales dobles. Se 

transforma una integral doble de la forma JJ f(x, y) dx dy, extendida a una 

s 

region S en el piano xy, en otra integral doble JJ F(u, v) du dv, extendida a una 

T 

nueva region T del piano uv. Vamos a estudiar a continuacion la relacion entre 
las regiones S y T y los integrandos f(x, y) y F(«, v). El metodo de sustitucion 
en integrales dobles es mas laborioso que en las simples debido a que existen dos 
sustituciones formales a efectuar, una respecto ary otra respecto a y. Esto signi- 
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fitca que en lugar de una funcion g que aparece en (11.29), tenemos ahora dos 
funciones, X e Y, que relacionan x, y con u, v del modo siguiente: 

(11.30) x — X(u,v), y = Y(u, v). 

Geometricamente, puede considerarse que las dos ecuaciones (11.30) definen 
una «aplicacion» que hace corresponder a un punto (u, v) del piano uv, el punto 
imagen (x, y) del piano xy. Un conjunto T de puntos del piano uv es aplicado en 
otro conjunto S del xy, como se representa en la figura 11.23. La aplicacion tam- 
bien puede expresarse mediante una funcion vectorial. En el piano xy trazamos 
el radio vector r que une el origen con un punto generico (x, y) de S (vease figu¬ 
ra 11.23). El vector r depende de u y v y puede considerarse como una funcion 
vectorial de dos variables defmida por la ecuacion 

(11-31) r(u, v) = X{u, v)i + Y(u, v)j si ( u,v)eT. 

Esta ecuacion se llama la ecuacion vectorial de la aplicacion. Como ( u, v) recorre 
puntos de T, el vertice de r ( u, v) describe puntos de S. 

Algunas veces las dos ecuaciones (11.30) pueden resolverse despejando 
u y. v en funcion de x e y. Cuando ello es posible podemos expresar el resultado 
en la forma 


m = U(x,y), v=V(x,y). 

Estas ecuaciones definen una aplicacion del piano xy en el piano uv, llamada 
aplicacion inversa de la definida por (11.30), ya que transforma los puntos de S 
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en los de T. Las llamadas aplicaciones uno a uno son de especial importancia. 
Esas transforman puntos distintos de T en puntos distintos de S; dicho de otro 
modo, dos puntos distintos de T no se aplican en el mismo punto de S mediante 
una aplicacion uno a uno. Tales aplicaciones establecen una correspondencia 
uno a uno entre los puntos de T y los correspondientes de S y nos permite (por 
lo menos teoricamente) regresar de S a T por la aplicacion inversa (que, natu- 
ralmente, es tambien uno a uno). 

Consideraremos aplicaciones para las que las funciones X e Y son continuas 
y tienen derivadas parciales continuas dXldu,dX/dv,d Y\du y d Y/dv en S. Para las 
funciones V y V se hacen analogas hipotesis. Esas restricciones no son en realidad 
muy rigurosas pues las cumplen la mayoria de las funciones que surgen en la 
practica. 

La formula para la transformation de integrales dobles puede escribirse asi: 


(11.32) ///(x, y) dx dy = // f[X(u, v ), Y(u, »)] \J(u, t>)| du dv. 

S T 

El factor J(u, v) que aparece en el integrando del segundo miembro desempena 
el papel del factor g\t) de la formula (11.29). Este factor se llama jacobiano de 
la aplicacion definida por (11.30); es igual al determinante 


dx 

dY 

du 

du 

dx 

dY 

dv 

dv 


Algunas veces se usa el sfmbolo 8(X, Y)/8(u, v) en lugar de J(u, v ) para repre- 
sentar el jacobiano. 

No discutiremos las condiciones mas generales en las que es valida la for¬ 
mula (11.32). Puede demostrarse (*) que (11.32) es valida si, ademas de la con- 
tinuidad de X, Y, U y V antes mencionada, suponemos que la aplicacion de T 
en S es uno a uno y que el jacobiano /(«, v) es distinto de cero. La formula tam¬ 
bien es valida aunque la aplicacion no sea uno a uno en un subconjunto de 
medida nula o el Jacobiano se anule en un conjunto de esta clase. 

En la seccion 11.30 demostraremos como la formula de transformacion 

(11.32) puede deducirse de uno de sus casos particulares, a saber, el case en 
que S es un rectangulo y la funcion / tiene el valor constante 1 en cada punto 
de S. En este caso particular se transforma en 

(11.33) jj dx dy = jj\J(u,v)\du dv. 

S T 

(*) Vease el teorema 10-30 del Analisis matematico del autor. 
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Aun en este caso la demostracion no es sencilla. En la section (11.29) se dara 
una demostracion de (11.33) con el auxilio del teorema de Green. En lo que 
resta de esta seccion presentaremos un razonamiento puramente geometrico que 
justifica la validez de (11.33). 

Interpretacion geometrica de la ecuacion (11.33): Tomemos una region T 
en el piano uv, como se representa en la figura 11.23, y sea S el conjunto de 
puntos del piano xy en los que T es aplicado por la funcion vectorial r dada por 
(11.31). Introducimos ahora dos nuevas funciones vectoriales V x y F 2 que se 
obtienen tomando las derivadas parciales de los componentes de r con respecto 
a u y v, respectivamente. Esto es, defmimos 


dr _ dX . dY . 
du du du J 



dX . dY . 

— / 4 - j 

dv dv 


v 


V 


■ v = constante 


,v = X(k,v) 

r = Y(u,v) 

—--► 



curva u 


u 


Figura 11.24 Una curva u y el correspondiente vector velocidad. 

Estos vectores pueden interpretarse geometricamente como sigue: Considere- 
mos un segmento rectilineo horizontal en el piano uv (sobre dicho segmento v es 
constante). La funcion vectorial r aplica este segmento sobre una curva (llamada 
curva u) en el piano xy, como se indica en la figura 11.24. Si consideramos u 
como un parametro representando «tiempo», el vector V 1 representa la velocidad 
de la posicion c y es por lo tanto tangente a la curva descrita por el extremo 
de r. Del mismo modo, cada vector V 2 representa el vector velocidad de una 
curva v obtenida haciendo u = constante. Una curva u y una curva v pasan por 
cada punto de la region S. 

Consideremos ahora un pequeno rectangulo de dimensiones A u y Av, como 
se presenta en la figura 11.25. Si A u es la longitud de un pequeno intervalo de 
tiempo, un punto de una curva u se desplaza, en el tiempo A u, a lo largo de la 
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Figura 11.25 La imagen de una region rectangular del piano uv es un paralelogramo 

curvil'meo en el piano xy. 


misma una distance aproximadamente igual al producto || FJ Am (ya que HFJ re¬ 
presen ta la velocidad y Am el tiempo). Analogamente, en el tiempo Av un punto 
de una curva v se desplaza a lo largo de ella una distancia aproximadamente 
igual a || V 2 1| Av. Por consiguiente, la region rectangular de dimensiones Am y Av 
del piano uv se transforma en una porcion del piano xy que es casi un parale¬ 
logramo, cuyos lados son los vectores Am y V 2 Av como se ve en la figura 11.25. 
El area de ese paralelogramo es el valor del producto exterior de los dos vec¬ 
tores Am y V 2 Av; este es igual a 


II(Pi Am) x (V 2 Av)|| = \\V, x V 2 \\ Am Av. 


Si calculamos el producto V 1 x V 2 en funcion de los componentes de F x y V 2 
encontramos 


Vi 


x V 2 = 


i j k 


d_X dr 

dX dY o 


du du 

du du 

— 




dX dY_ 

w ay Q 


dv dv 

dv dv 



k = J(u, v)k. 


Luego la magnitud de V 1 x V 2 es exactamente /(m, v) y el area del paralelo¬ 
gramo curvilfneo de la figura 11.25 es casi igual a /(m, v) AmAv. 

Si /(m, v) = 1 para todos los puntos de T, el «paralelogramo® tiene la misma 
area que el rectangulo y la aplicacion conserva las areas. Si no es asi, para obtener 
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el area del paralelogramo debemos multiplicar el area del rectangulo por | /(«, y)|. 
Esto sugiere que el jacobiano puede imaginarse como un «factor de ampliation* 
de areas. 

Sea ahora P una partition de un rectangulo R que contenga toda la region T 
y consideremos un rectangulo parcial de P de dimensiones A u y Ay. Si A u y 
Ay son pequenos, la funcion / es casi constante en el rectangulo parcial y por lo 
tanto / actua practicamente como una funcidn escalonada en R. (Asignamos a 
/ el valor cero en el exterior de T.) Si consideramos / como una autentica funcion 
escalonada, entonces la integral doble de |/| sobre R (y por tanto sobre T) es 
una suma de productos de la forma |/(«, y)| Am Ay y las anteriores consideracio- 
nes sugieren que esta suma es aproximadamente igual al area de S, que conoce- 
mos como la integral doble / f dx dy. 

s 

Esta discusion geometrica, que tan sdlo sugiere por que puede esperarse la 
validez de una formula como la (11.33), puede constituir la base de una demos- 
tracion rigurosa, pero los detalles son largos e intrincados. Como antes se ha 
dicho, se dara en un capftulo posterior una demostracion de (11.33) con funda- 
mento totalmente distinto. 

Si /(m, v) = 0 en un punto (n, y), los dos vectores V l y V 2 son paralelos (ya 
que su producto exterior es el vector nulo) y el paralelogramo degenera. Tales 
puntos se llaman puntos singulares de la aplicacidn. Como ya hemos mencionado, 
la formula de transformation (11.32) tambien es valida con tal que exista un 
numero finito de puntos singulares o, mas general, cuando tales puntos formen 
un conjunto de medida nula. Esto es lo que ocurre en todas las aplicaciones que 
usaremos. En la seccidn siguiente empleamos la formula (11.32) en dos ejemplos 
importantes. 


11.27 Casos particulars de la formula de transformacion 


ejemplo 1. Coordenadas polares. En este caso escribimos r y 0 en lup» r 
de m y y y defmimos la aplicacidn con las ecuaciones 


x = r cos 0 , y = rsen 0. 


Esto es, X(r, 6) — r cos 6 e Y{r, 6) = r sen 0. Para conseguir una aplicacidn uno 
a uno mantenemos r > 0 y 9 en un intervalo de la forma 0 O ^ 9 < 9 0 + 2tt. Por 
ejemplo, la aplicacidn es uno a uno en cualquier subconjunto del rectangulo 
(0> a J X 2 tt) del piano rO . El jacobiano de esta aplicacidn es: 


J(r, 0) = 


dX 

dY 

dr 

dr 

dX 

dY 

de 

dO 


cos 6 sen 0 
—rsenfi rcosS 


r(cos 2 0 + sen 2 6) — r. 
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Luego la formula de transformation (11.32) toma la forma 

jjf(x,y)dxdy = J j f(r cos 6, r sen 6) r dr dO. 

S T 

Las curvas r son rectas por el origen y las curvas 6 son cfrculos concentricos con 
el origen. La imagen de un rectangulo en el piano rO es un «paralelogramo» en el 
xy limitado por dos radios y dos arcos de cfrculo, como se ve en la figura 11.26. 



Figura 11.26 Transformacion por coordenadas polares. 

El jacobiano se anula cuando r = 0, pero esto no afecta la validez de la fdrmula 
de transformacidn porque el conjunto de puntos con r — 0 tiene contenido o 
medida nula. 

Puesto que V 1 = cos 0 i + sen Oj, tenemos || V 1 || = 1, asf que no existe dis- 
torsion de distancias a lo largo de las curvas r. Por otra parte, 

V 2 = — rsendi + r cos dj, ||F 2 ||=r, 

de modo que las distancias a lo largo de las curvas 0 quedan multiplicadas por 
el factor r. 

Las coordenadas polares son particularmente convenientes cuando la region 
de integracion tiene fronteras a lo largo de las cuales r o 8 es constante. Por ejem- 
plo, consideremos la integral para calcular el volumen de un octante de esfera de 
radio a. 


jj V a* — x 2 — y 2 dx dy, 
s 
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en la que la region S es el primer cuadrante del disco circular x 2 + y 2 < a 2 . 
En polares la integral se transforma asf 

JJ V a 2 — r 2 rdrdO, 

T 

donde la region de integration T es ahora un rectangulo [0, a] X [0, \tt] . Inte- 
grando primero respecto a 6 y luego respecto a r obtenemos: 

IT Ja^7rdrd0 = I \ a rJ^?dr = 5 . C j" ~ ^ •_ 

V 2 Jo 2 -3 o 6 

Este es el mismo resultado que se obtuvo antes, pero en polares resulta el calculo 
mas comodo y breve. 

ejemplo 2. Transformaciones lineales. Una transformacion lineal es una 
aplicacion definida por un par de ecuaciones de la forma 

(11.34) x = Au + Bv, y = Cu+Dv, 

donde A, B, C, D son constantes dadas. El jacobiano es: 

/ (u, v) = AD - BC, 

y para asegurar la existencia de la transformacion inversa suponemos AD—BC¥=0. 
Esto nos garantiza que podamos resolver las ecuaciones lineales (11.34) respecto a 
u y v en funcion de x e y. 

Las transformaciones lineales transforman rectas en rectas. Por lo tanto, la 
imagen de un rectangulo en el piano uv es un cuadrilatero en el xy, y su area es 
la del rectangulo multiplicada por el factor |/(«, v)| = \AD - BC\. La formula 
de transformacion (11.32) se convierte en esta otra 

JJ7(*, y) dx dy = | AD - BC | {j f(Au + Bv, Cu + Dv ) du dv. 

S T 

A continuation damos un ejemplo en el que se pone de manifiesto la utilidad 
de un cambio lineal de variable. Consideremos la integral 

JJ e <v ~ x)/(v+x) dxdy, 
s 

en la que S es el triangulo determinado por la recta x + y = 2 y los dos ejes 
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Figura 11.27 Aplicacion definida por unci transjormacion lineal 


coordenados. (Vease figura 11.27.) La presencia de y - x e y + x en el integrando 
gugiere el cambio de variable 

u = y — x, v =y + x. 

Resolviendo respecto a x e y encontramos 



El jacobiano es J(u,v) =-|. Para encontrar la imagen T de S en el piano uv 
observemos que las rectas r = 0 e y = 0 se transforman en las rectas u = v y 
u = — v, respectivamente; la recta x + y = 2 se transforma en la recta v = 2. 
Los puntos interiores a S satisfacen 0<x + y<2yse transforman en puntos 
de T que satisfacen 0 < v < 2. Por lo tanto, la nueva region de integracion T 
es una region triangular, como se ve en la figura 11.27. La integral doble que 
consideramos se transforma asf 
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11.28 Ejercicios 


rr c ®^ a un0 ' os ejercicios del 1 al 5, dibujar la region S y expresar la integral doble 
J J l(x, y) dx ay como una integral reiterada en coordenadas polares. 

S' 

I - S — {(x,y) | x 2 + y 2 <; a 2 }, donde a > 0. 

2.5 = {(j:, y)\x 2 +y 2 <, 2x }. 

3 - S = {(x,y) | a 2 <, x 2 + y 2 <, b 2 } , donde 0 <a<b. 

4. 5 = {(*,/) |0;£ji£l -*,0 1}. 

5 - S = {{x,y) | * 2 <,y £ 1, -1 ^ 1}. 


En los ejercicios del 6 al 9, transformar la integral a coordenadas polares y calcular su 
valor. (La letra a representa una constante positiva.) 


6 - Jo"[Jo 201 * (x * +f> d y\ dx - 


8 ‘ JoK ^ 2 +fy' Ad y\ dx. 


7 ■ £[|> +fdy] dx. 9. (x 2 +f)dx] dy. 

En los ejercicios del 10 al 13, transformar cada una de las integrales dadas en una o mas 
integrates reiteradas en polares. 


10 - Jo [Jo f^y^ d y\ dx - 

n - j;[j; 3 f ( ^ x2 +y 2 )dy] dx - 


iz j:[j;_: * <**• 

13 - fo[fo f (x ’y )d y ] dx - 


14. Utilizar una conveniente transformation lineal para calcular la integral doble 


JJ (x -y) 2 sen 2 (x +y)dxdy 
8 

donde S es el paralelogramo con vertices (n, 0), (2n, n), (n, 2n), (0, n). 

15. Los^ vertices de un paralelogramo S del piano xy son los puntos (0,0), (2,10), (3,17) 

a) Hallar una transformacion Hneal u = ax + by, v = cx + dy, que aplique S en un 
rectangulo R del piano uv con vertices opuestos en (0,0) y (4,2). El vertice (2,10) de- 
bera aplicarse en un punto del eje u. 

b) Calcular la integral doble JJ xy dx dy transformandola en una integral equivalente en 

s 

el rectangulo R del apartado a). 

16 Si r > 0, pongamos l(r) = J^ r e~ u2 du. 

a) Demostrar que / 2 (r)=JJ e -(.x*+n*)dx dy, en donde R es el cuadrado /? = [ — r, r] x [— r, r], 

R 

b) Si Ci y Ci son los discos circulares inscrito y circunscrito a R, demostrar que 


JJ <>-<**+**) dx dy < I 2 (r) < 

Ci 


J J e dx dy. 

c„ 
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c) Expresar las integrales a lo largo de C, y C 2 en coordenadas polares y aplicar b) para 
deducir que /(r) V?r cuando r -» <*>. Esto demuestra que J® <r“ 2 du = \Jyj2. 

d) Aplicar el apartado c) para deducir que F(|) = y/n, siendo r la funcion gamma. 

17. Considerar la aplicacion definida por las ecuaciones 

x = u + v, y —v — u 2 . 

a) Calcular el jacobiano /(«, v). 

b) Un triangulo T en el piano uv tiene vertices (0,0), (2,0), (0,2). Representar, mediante 
un dibujr, la imagen S en el piano xy. 

c) Calcular el area de S mediante una integral doble extendida a S y tambien mediante 
otra integral doble extendida a T. 

d) Calcular J J (x - y + l)” 2 dx dy. 

s 

18. Considerar la aplicacion definida por las dos ecuaciones x — u 2 — v 2 ,y = 2uv. 

a) Calcular el jacobiano /(«, v). 

b) Sea T el rectangulo en el piano uv con vertices (1,1), (2,1), (2,3), (1,3). Represen¬ 
tar, mediante un dibujo, la imagen S en el piano xy. 

c) Calcular la integral doble ffxy dx t/yjhaciendo el cambio de variable x = u 2 — v 2 , 

y = 2uv, donde C = {(*,/) | x 2 + y 2 <, 1}. 

19 . Calcular la integral doble 

R 

sobre el disco circular R = {(x, y) | x 2 + y 2 <, r 2 }. Determinar los valores de p para 
los que I(p,r ) tiene li'mite cuando r—> + 

En los ejercicios 20 al 22, establecer las igualdades que se dan mediante la introduccion 
de un conveniente cambio de variable en cada caso. 

20. jj/(x + _y) dx dy = /(«) du , donde 5 = {(x, y) | |x| + \y\ <. 1}. 

s 

21. |"J f(ax + by + c) dx dy = 2 J ^ % /l — u 2 f(uyja 2 + b 2 + c)du, 

s 

donde S = {(x, y) | x 2 + y 2 <, 1} y a 2 + b 2 9*0. 

22. J J f(xy) dx dy = log 2 f{u) du , siendo S la regi6n del primer cuadrante limitada por 

s 

las curvas xy = 1 , xy = 2, y = x , y = 4x. 
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11.29 Demostracion de la formula de transformacion en un caso particular 

Como ya se ha indicado antes, la formula de transformacion 


(11.35) // fix, y) dxdy = |J f[X(u, v), Y(u, a)] | J(u, u)| du dv 

S T 

puede deducirse como una consecuencia del caso particular en el que S es un 
rectangulo y / es identicamente igual a 1. En este caso la formula se simplifica, 
reduciendose a 


(11.36) 


j j dx dy = j j | J(u, a) | du dv. 

R R* 


Aquf R representa un rectangulo en el piano xy y R* representa su imagen en 
el piano uv (vease figura 11.28) obtenida con una aplicacion uno a uno 

u = U(x,y), v=V(x,y). 

La aplicacion inversa viene dada por 



Figura 11.28 Ley de transformacion para integrates dobles deducida del teorema de Green. 
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y J(u, v ) es el determinante jacobiano 


J(u, v ) 


dX 

d_X 

du 

dv 

dY 

dY 

du 

dv 


En esta section utilizamos el teorema de Green para demostrar (11.36), y 
en la siguiente deducimos la formula mas general (11.35) a partir del caso par¬ 
ticular (11.36). 

Para la demostracion suponemos que las funciones X e Y tienen derivadas 
parciales segundas continuas y que el jacobiano nunca se anula en R*. Enton- 
ces J(u, v ) es siempre positivo o siempre negativo. El significado de este signo 
de J(u, v) es que cuando un punto (x, y) describe la frontera de R en el sentido 
contrario al de las agujas del reloj, el punto imagen (u, v) describe la frontera 
de R* en el mismo sentido si J(u, v ) es positivo y en sentido contrario si J(u, v) 
es negativo. En la demostracidn supondremos que /(«, v) > 0. 

La idea de la demostracidn es la de expresar cada integral doble de (11.36) 
como una integral de lfnea usando el teorema de Green. Comprobamos luego la 
igualdad de las dos integrales de lfnea expresandolas en forma parametrica. 
Comenzamos con la integral doble en el piano xy, escribiendo 

//*"-//(fr-fp**- 

Ji R 

en donde Q(x, y) = x y P(x, y) = 0. Segun el teorema de Green esta integral 
doble es igual a la integral de lfnea 

(11-37) j c P dx + Q dy = j c x dy. 

Aquf C es la frontera de R recorrida en el sentido contrario al de las agujas del 
reloj. 

Analogamente, transformamos la integral doble en el piano uv en una inte¬ 
gral de lfnea a lo largo de la frontera C* de R*. El integrando, /(«, v), puede 
escribirse como sigoe: 


u , dX BY 

JO*. v ) = T- -z- 

ou dv 


dXdY 
dv du 

d_ 
dv\ 


dXdY d 2 Y 

“f - A 

du dv du dv 


- X 


d 2 Y dXdY 




dv du dv du 
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Aplicando el teorema de Green a la integral doble sobre R* encontramos 


J(u, v ) du dv — 

02 1 

du + X — dr) 

Jc 

R* 

du 

dv / 


Por consiguiente, para completar la demostracion de (11.36) necesitamos 
tan solo comprobar que 

(xdy=( (x^-du + X^dv ). 

Jc Jc * \ du dv / 

Introducimos una parametrizacion de C* y utilizamos esta para hallar una 
representation de C. Supongamos que C* esta descrita por una funcion a definida 
en un intervalo [a, 6], por ejemplo 


Llamemos 


a(t) = U(t)i + V(t)j. 

P(0 = X[U(t), V(t)]i + Y[U(t), V(t)]j. 


Entonces cuando t varia en el intervalo [a, b], el vector a (t) describe la curva C* 
yP (<) la C. Segun la regia de la cadena, la derivada de p viene dada por 


m = 


Y U 'V> + ¥ v 

du dv 


i + 


Y U V) + y • 

du dv 


Luego 


(xdy= f*[i/(o, vmtfr u\t) + ^ no) dt. 

JC Ja \OU OV J 


La ultima integral sobre [a, 6] se obtiene tambien parametrizando la integral de 
linea sobre C* en (11.37). Por consiguiente las dos integrales de linea (11.37) 
son iguales, lo que demuestra (11.36). 

11.30 Demostracion de la formula de transformacidn en el caso general 

En esta section deducimos la formula general de transformation 


///(*, y) dx dy = JJ f[X(u, v), Y(u, u)] \J(u, r)| du dv 

S T 


(11.38) 
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a partir del caso particular tratado en la seccion anterior, 

(11.39) jj dxdy = jj\J(u,v)\dudv, 

R R* 

en donde R es un rectangulo y R* su imagen en el piano uv. 

Demostramos ante todo que 

(11.40) || s(x, y) dx dy = || s[X(u, v), Y(u, a)] \J(u, a)| du dv , 

R R* 

siendo s una funcion escalonada cualquiera definida en R. A tal fin, sean P una 
particion de R en mn subrectangulos Rij de dimensiones Axj y Ay,-, y c,-,- el valor 
constante que toma s en el subrectangulo abierto Rij. Aplicando (11.39) al rec¬ 
tangulo Rij encontramos 


Ax,-Ay } - — jj dx dy = || |J(u, p)| du dv. 

Rij Rn* 

Multiplicando ambos miembros por c,-,- y sumando respecto a los indices i, / 
obtenemos 

it m n m r r 

(ii.4i) 2 H c iA x i^yi = 2 2 c u J J i^)l du dv. 

i=15=1 *“ 1 Ra* 

Puesto que s es una funcion escalonada, esto es lo mismo que 



Utilizando la propiedad aditiva de las integrales dobles vemos que (11.42) es lo 
mismo que (11.40). As! pues, (11.40) es una consecuencia de (11.39). 

Seguidamente demostramos que la funcion escalonada s de (11.40) puede 
reemplazarse por cualquier funcion f para la cual existan ambos miembros de 

(11.40). Sea / integrable en un rectangulo R y elijamos funciones escalonadas 
s y t que satisfagan las desigualdades 

(11.43) s(x, y ) ^ f{x, y) < /(x, y), 


para todos los puntos (x, y) de R. Tenemos entonces 

(11.44) s[X(u, v), Y(u, »)] <f[X(u, v), Y(u, »)] < t[X(u, v), Y(u, v)] 
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para todo punto (u, v) en la imagen R*. Por brevedad, escribimos S(u, v) en 
lugar de s[X(u, v), Y(«, v)] y defmimos F(u, v ) y T(u, v) de modo parecido. Mul- 
tiplicando las desigualdades de (11.44) por |/(«, v)j e integrando en R* obtenemos 


JJ S(u, v ) \J(u, a)| du dv < jj F(u, v) \J(u, t>)| du dv < JJ T(w, v ) \J{u, u)| du dv. 

R* R* R* 

Debido a (11.401, las desigualdades anteriores son las mismas que 


JJ s(x, y) dx dy < JJ F(u, v) \ J(u, r)| du dv < JJ t(x, y) dx dy. 

r r* n 

Por consiguiente, JJ F(u, v) | J(u, v) | du dv es un numero comprendido entre 

R‘ 

las integrales JJ s(x, y) dx dy e JJ t(x, y) dx dy para todo par de funciones esca- 
r R 

lonadas s y t elegidas que satisfagan (11.43). Ya que / es integrable, esto impli- 
ca que 

y) dx dy = JJ F(u, v ) \J(u, »)| du dv 
r r * 

y por tanto (11.38) es valida para funciones integrables definidas sobre rec- 
tangulos. 

Una vez probada la validez de (11.38) para rectangulos podemos facilmente 
extenderla a regiones S mas generates por el procedimiento usual de elegir un 
rectangulo R que contenga a S y considerar en lugar de / otra funcion f que 
coincide con / en S y vale 0 fuera de S. Entonces observamos que 


JJ/ = JJ/= JJ/P/w. V X Y(u, »)] | J(u, p)| du dv = JJ F{u, v) \J(u, p)| du dv 

S R R* T 

lo cual demuestra que (11.38) es, en realidad, una consecuencia de (11.39). 

11.31 Extensiones a un numero mayor de dimensiones 

El concepto de integral multiple puede extenderse del espacio de dos di¬ 
mensiones al de n dimensiones para cualquier n ^ 3. Puesto que el desarrollo 
es completamente analogo al caso n — 2 tan solo apuntamos los principales re- 
sultados. 

El integrando es un campo escalar f definido y acotado en un conjunto S 
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del n-espacio. La integral de / en S, llamada integral n-multiple, se representa 
mediante los simbolos. 

/•••//> o / • • • J/Oi, ■ ■ ■, • • • dx n , 

s s 

con n signos de integral, o mas sencillamente con un signo integral, J s f(x) dx, 
en donde x = (x lt , x n ). Cuando n = 3 escribimos (x, y, z) en lugar de 
(X!,X 2 , x 3 ) y ponemos para las integrales triples 

////> o jjjf(x,y,z)dxdydz. 
s s 

Definimos primero la integral n-multiple para una funcion escalonada defi- 
nida en un intervalo n-dimensional. Recordemos que un intervalo cerrado n-di- 
mensional [a, b] es el producto cartesiano de n intervalos unidimensionales 
cerrados [at, bk], en donde a = (a,,..., a„) y b = (b u .... b„). Un intervalo 
n-dimensional abierto (a, b) es el producto cartesiano de n intervalos abiertos 
(ak, bk )• El volumen de [a, b] o de (a, b ) se define como el producto de las 
longitudes de los intervalos componentes 


-«!)••• (b n - a n ). 


Si Pi,..., P n son particiones de [a lt bj,.... [a„, 6„], respectivamente, el 
producto cartesiano P —P x X ... X P„ sera una particion de fa, A], Una fun¬ 
cion / definida en [a, b ] se llama escalonada si es constante en cada uno de los 
subintervalos abiertos determinados por una cierta particion P. Entonces la inte¬ 
gral n-multiple de una tal funcion escalonada esta definida por la formula 

[ 0 , 6 ] * 

en donde c, es el valor constante que toma / en el z-esimo subintervalo abierto 
y Vi es el volumen del z-esimo subintervalo. La suma es una suma finita extendida 
a todos los subintervalos de P. 

A partir de la integral n-multiple para funciones escalonadas, definimos la 
integral para funciones acotadas mas generales definidas en intervalos, siguiendo 
el metodo corriente. Sean s y / funciones escalonadas tales que s < / ^ t en 
[a, b]. Si existe un numero / y solo uno tal que 

/-/•sis/-/. 

[o,b] [o,b] 
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cualesquiera que sean s y t que satisfagan s < / < t, entonces se dice que / es 
integrable en [a, A], y el numero I es la integral n-multiple de /, 

Como en el caso bi-dimensioual, la integral existe si / es continua en [a, A]. 
Tambien existe si / es acotada en [a. A] y si el conjunto de discontinuidad de f 
tiene contenido n-dimensional nulo. Un conjunto acotado S tiene contenido 
n-dimensional nulo si para todo e > 0 existe una coleccion finita de intervalos 
n-dimensionales cuya reunion cubre a S y tal que la suma de sus volumenes no 
supera a e. 

Para definir la integral n-dimensional de una funcion acotada / sobre un 
conjunto acotado S mas general, consideramos una nueva funcion / extension de 
f y que coincide con ella en S y vale 0 fuera de S; la integral de / sobre S se 
define como la integral de f sobre un intervalo que contenga a S. 

Algunas integrales multiples pueden calcularse mediante integrales reitera- 
das de dimension inferior. Por ejemplo, supongamos que S es un conjunto 
en el espacio tri-dimensional definido asi: 

(11.45) S = {(x,y,z)\(x,y)eQ y <Pi(x,y) <, z <, <p 2 (x,y)}, 

siendo Q una region bi-dimensional, llamada proyeccion de S en el piano x, y, y 
<p l y <p 2 funciones continuas en S. (En la figura 11.29 se muestra un ejemplo.) 
Los conjuntos de este tipo estan limitados por dos superficies de ecuaciones car- 
tesianas z = cp^x, y) y z = <p 2 (x, y) y (a veces) una porcion de superficie cilin- 
drica engendrada por una recta que se desplaza paralelamente al eje z siguiendo 
la frontera de Q. Las rectas paralelas al eje z tienen comunes con ese conjunto 
segmentos rectilineos que unen la superficie superior con la inferior. Si / es con¬ 
tinua en el interior de S tenemos la formula de iteracion 


(H' 4 6) JJj fix, y, 2) dx dy dz = JJ [/" fix, y, z) dz ] dx dy . 

S Q 

Esto es, para rey fijos, la primera integracion se efectua respecto a z desde la 
superficie frontera inferior hasta la superior. Esto reduce el calculo a una integral 
doble sobre la proyeccion Q, que puede tratarse con los metodos antes expuestos. 

Existen otros dos tipos de conjuntos analogos a los descritos por (11.45) en 
los que los ejes x e y desempenan el papel del eje z, con las proyecciones en los 
pianos yz o xz, respectivamente. Las integrales triples sobre tales conjuntos pue¬ 
den calcularse por iteracion, con formulas analogas a (11.46). La mayoria de los 
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conjuntos tri-dimensionales que encontraremos son de uno de los tres tipos men- 
cionados o pueden descomponerse en un numero finito de fragmentos, cada uno 
de los cuales es de uno de esos tipos. 

Existen muchas formulas de integracion reiterada para las integrales M-mul- 
tiples cuando n > 3. Por ejemplo, si Q es un intervalo fc-dimensional y R un in¬ 
terval m-dimensional, entonces una integral (m + /c)-multiple sobre Q X R es 
la iteracion de una integral m-multiple y una integral ^-multiple. 

/*"//=/•" / [/"*J f dx 1 ‘ ‘ ’ dx r?\ dx m+1 ■ ■ ■ dx m+k > 

QxR Q R 

con tal que existan todas las integrales multiples que aparezcan en el calculo. 
Luego veremos en este capftulo como se usan las integrales multiples iteradas al 
calcular el volumen de una esfera n-dimensional. 

11.32 Cambio de variables en una integral n-multiple 

La formula para efectuar un cambio de variables en una integral doble tiene 
una extension directa para las integrales n-mdltiples. Introducimos unas nuevas 
variables u x .... ,u„ ligadas a x 1 x„ por n ecuaciones de la forma 


*1 — ^l( u l > ■ • • > w n) > 


X n ^n(Ml s • • • > W n ) . 
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Pongamos x = (Xi,..., x n ), « = (ui, ..., Un), y X — (Xj ,..., X„). Entonces 
esas ecuaciones definen una aplicacion vectorial 

X : T-+S 

de un conjunto T del n-espacio en otro con junto S del mismo. Supongamos que 
la aplicacion X es uno a uno y derivable con continuidad en T. La formula de 
transformacion para las integrales n-multiples toma la forma 

(11.47) J g /(*) dx = j T flX(u)] |det DX(u)\du, 

en donde DX(u) = [DjX k (uj] es la matriz jacobiana del campo vectorial X. En 
funcion de los componentes tenemos 

M») ••• D n xM 

DX(u) = • • 

_D 1 X n (u) D 2 X n (u ) ••• D n X n (u). 

Como en el caso bi-dimensional, la formula de transformacion es valida si 
X es uno a uno en T y si el determinante jacobiano J(u) = det DX(u} nunca es 
cero en T. Es tambien valida si la aplicacion deja de ser uno a uno en un sub¬ 
con junto de T que tenga contenido n-dimensional nulo, o si el determinante jaco¬ 
biano se anula en un tal subconjunto. 

Para el caso tri-dimensional escribimos ( x, y, z) en lugar de (x lt x 2 , x 3 ), 
( u, v, w) en lugar de (w„ u 2 , u 3 ) y (X, Y, Z) en lugar de (X u X 2 , X 3 ). La formula 
de transformacion para las integrales triples toma la forma 

////(*, y, z)dxdy dz 
s 

(11.48) = JJJ f[X(u, v, w), Y(u, v, w), Z(u, v, w)] \ J(u, v, w)| du dv dw, 

T 

donde }{u, v, w) es el determinante jacobiano. 



dX 

dY 

dZ 


du 

du 

du 

J(u, V, w) = 

dX 

dY 

dZ 

dv 

dv 

dv 


dX 

dY 

dZ 


dw 

dw 

dw 
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En el espacio tri-dimensional el determinante jacobiano puede imaginarse como 
un factor de ampliation de los volumenes. En efecto, si introducimos la funcion 
vectorial r definida por la ecuacion 

r(u, v, w) = X(u, v, w)i + Y(u, v, w)j + Z(u, v, w)k, 


y los vectores 

„ dr BX . BY BZ 
v '~Yu~Tu‘ + d^ , + Tu k - 

v dr dX . , dY . , 8Z , 

v ^J v = T v l + T v ] + iT v k ' 



d_X. dY. dZ 
dw dw^ dw 


un razonamiento parecido al que se dio en la seccion 11.26 sugiere que un ortoedro 
de dimensiones A u, Av, A w del espacio uvw se transforma en un solido, que es 
casi un «paralelepfpedo» curvilineo, en el espacio xyz determinado por los tres 
vectores V 1 Au, V 2 Av, y V 3 Aw. (Ver figura 11.30.) Las caras que limitan este 
solido son superficies obtenidas haciendo u = constante, v = constante, y w = 
constante, respectivamente. El voiumen de un paralelepipedo es igual al valor 
absoluto del producto mixto de los tres vectores que lo determinan, de manera 
que el voiumen del paralelepipedo curvilineo es aproximadamente igual a 


|(Fj Am) • (V 2 Aa) x (F s Aw)| = \V 1 -V 2 x V 3 \ Xu Av Aw = \J(u, v, w)\ Au Av \w. 



Figura 11.30 Transformacion mediante coordenadas cilindricas. 
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11.33 Ejemplos resueltos 

En los dos ejemplos que siguen se estudian dos casos particulares impor- 
tantes de (11.48). 

ejemplo 1. Coordenadas cillndricas. Ponemos aquf r, 8, z en lugar de 
u, v,w y definimos la aplicacion mediante las ecuaciones 

(11.49) x = rcos0, y = rsenO, z = z. 

Es decir, reemplazamos x e y por sus coordenadas polares en el piano xy y no 
cambiamos la z. Tambien aqui, para conseguir una aplicacion uno a uno debemos 
mantener r > 0 y limitar 8 a un intervalo de la forma 8 0 ^ 8 < 8 0 + 2ir. La 
figura 11.30 muestra la transformacion de un ortoedro del espacio rdz, 

El jacobiano de la aplicacion (11.49) es: 


J(r, 6, z) = 


cos 6 sen 6 0 

—rsenO rcosO 0 
0 0 1 


= r(cos 2 6 + sen 2 0) = r, 


y por lo tanto, la formula de transformacion (11.48) se convierte en 


/// f(x, y, z) dx dy dz = J jJ f(r cos 6, r sen 0, z)r dr dd dz. 
s T 

El jacobiano se anula cuando r = 0, pero esto no afecta la validez de la formula 
de transformacion porque el conjunto de puntos con r = 0 tiene medida tri-di- 
mensional 0. 

ejemplo 2. Coordenadas esfericas. En este caso, en lugar de u, v, w pone¬ 
mos p, 6, <p y la aplicacion se define por las ecuaciones 

x = p cos 0 sen cp, y = p sen 6 sen (p , z = p cos <p. 

El significado geometrico de p, 8, y rp se pone de manifiesto en la figura 11.31. 
A1 objeto de conseguir un aplicacion uno a uno limitamos las coordenadas por 
p > 0, 0 ^ 8 < 2n, y 0 ^ q> < tt. Las superficies p = constante son esferas con- 
centricas de centra en el origen, las superficies 8 = constante son pianos que pasan 
por el eje x, y las superficies <p = constante son conos circulares cuyo eje es el 
eje z. Por consiguiente, una caja rectangular en el espacio pO<p se transforma en 
un solido del tipo que se ve en la figura 11.31. 
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9 


x = p sen <P cos 9 
v = p sen 9 sen 9 
z ~ p cos cp 


9 


x 


Figure 11.31 Transformaci6n mediante coordenadas esfSricas. 

El jacobiano de la aplicacion es 

cos 6 sen cp sen 0 sen cp cos 9 0 
J(p,0,(p)= —psenOsetup pcosdsencp 0 = — p 2 sen 9 ?. 

p cos 0 cos cp p sen 0 cos cp —p sen cp 

Ya que sen cp ^ 0 si 0 ^ cp < it, tenemos \J(p, 0, 99 )! = p 2 sen 99 y la formula de 
transformacion de integrales triples es: 

JJJ/Oc, y, z) dxdydz = JJJ F(p, d, <p)p 2 sen cp dp dd dcp, 

S T 

donde F(p, Q <p) — f(p cos & sen cp, p sen 9 sen cp, p cos <p). Si bien el jacobiano 
se anula cuando cp = 0 la formula de transformacion es aun valida porque el con- 
junto de puntos con 95 = 0 tiene medida tri-dimensional 0 . 

En concepto de volumen puede extenderse a ciertas clases de conjuntos (11a- 
mados conjuntos medibles)del n-espacio de tal manera que si S es medible, su 
volumen es igual a la integral de la funcion constante igual a 1 en S. Esto es, 
si v(S) representa el volumen de S, tenemos 

v(S) = J* • • • J dx x • • • dx n . 

s 

No vamos a intentar describir la clase de los conjuntos para los que es valida 
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esta formula. En lugar de ello, expondremos como puede calcularse la integral 
en algunos casos particulares. 

ejemplo 3. Volumen de un intervalo n-dimensional. Si S es un intervalo 
n-dimensional, por ejemplo S = [a u bj X ... X \_a n , b„], la integral multiple 
para el calculo de v(S) es el producto de n integrales uni-dimensionales, 

v(S) = P 1 dx t ■ ■ • P" dx n = (b x - di) • • • ( b n - a n ). 

J a n 


Esto coincide con la formula dada antes para el volumen de un intervalo n-dimen¬ 
sional. 

ejemplo 4. Volumen de urn esfera n-dimensional. Designemos con S„(a) 
la esfera n-dimensional (o n-esfera) de radio a dada por 


y sea 


S„(a) = {(Xj,. . ., x n ) | x\ -f ■ • • + x 2 n < a 2 }, 
K(a) = /“■/ dx t • • • dx n , 


S„(a)‘ 


el volumen de S„(a). Demostraremos que 


(11.50) 


V n (a) = 


. nl 2 


r(|n + 1) 


a , 


donde r es la funcion gamma. Para n = 1 la formula da V 1 (a) = 2a, que es la 
longitud del intervalo [-a, a]. Para n = 2 da V 2 (a) = rra 2 , que es el area de 
un disco circular de radio a. Demostraremos (11.50) para n > 3. 

Primero demostraremos que para todo a > 0 tenemos 


(11.51) 


V n (a) = a”V n (l). 


Dicho de otro modo, el volumen de una esfera de radio a es a” multiplicado por 
el volumen de una esfera de radio 1. Para probarlo hacemos el cambio lineal de 
variable x = au para aplicar S„( 1) en S„(a). La aplicacion tiene jacobiano igual 
a a n . Luego 


K(a) - J ■ ■ ■ f dx 1 ■ ■ ■ dx n = J • • • J a n du x • • • du n = a n V n { 1). 


S n (a) 


S n ( 1) 
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Esto demuestra (11.51). Por consiguiente, para demostrar (11.50) basta probar que 

j.n/2 

(U- 52 ) V nW = + j) • 

Observemos primero que x\ + • • ■ + x* <, 1 si y solo si 

A + • • • + x 2 _ 2 < 1 - x 2 n _! - x 2 y xl _j + x 2 < 1. 

Por lo tanto podemos escribir la integral que da V,n(l) como la iteration de una 
integral (n — 2)-multiple y una integral doble, del modo siguiente: 


(11.53) V n {\) = JJ [ / ‘ ' J dx x •• • dx„_ 2 J dx n _ x dx n . 

2 2 2 2 2 2 
*n-l+*n<l xi+-■ ■+x n -i<l—x n -i—x n 

La integ ral interior esta extendida a la esfera (n — 2)-dimensional S«- 2 (-R), siendo 
R = v 7 l - xjU - x*, con lo que es igual a 

K„_ 2 (i?) = R”- 2 K n _ 2 (l) = (1 - x 2 „ T - x^ 2 - 1 K n _ 2 (l). 

Ponemos ahora x en lugar de e y en lugar de x„. Entonces (11.53) toma la 
forma 

F„(l) = K„_ 2 (l) || (1 - x 2 - y 2 )" /2_1 dx dy. 

**+»’< 1 

La integral doble la calculamos transformandola a coordenadas polares y obte- 
nemos 

K„(l) = E„_ 2 (l) r f 1 (1 - rY^rdr dO = E n _ 2 (l) — . 

Jo Jo n 

Es decir, los numeros V„(l) satisfacen la formula de recurrencia 

K„(l) = — E„_ 2 (l) sin >3. 


Pero la sucesion de numeros {/(«)} definida por 

„nli 

/(„) _ — Z - 

r(i« + i) 


satisface la misma formula de recurrencia debido a que T(s + 1) = sr(.v). Asi- 
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mismo, r(i/ 2 ) = VtF (vease ejercicio 16, section 11.28), con lo que r(%) = y 2 \/¥ 
y /(1) : V,(l) = 2. Tambien, /(2) = V 2 (l) = luego tenemos /(«) = V„(l) 
para todo n > 1. Esto demuestra (11.52). 

11.34 Ejercicios 

Calcular cada una de las integrales triples en los ejercicios del 1 al 5. Representar en 
cada caso la region de integration. Supongase la existencia de todas las integrales que se citan. 

1. JJJ xy 2 z 3 dx dy dz , siendo S el solido limitado por la superficie z = xy y los pianos 

s > 

y = t,*=l,yz = 0. 

2. JJJ (1 + x + y + z)~ 3 dxdydz, siendo S el solido limitado por los tres pianos coon¬ 
s' 1 

denados y el piano x 4- y + z = 1. 

3. JJJ xyz dx dy dz , siendo S — {(x,y, z) x 2 + y 2 + z 2 <, 1, x > 0,y > 6, z > 0}. 
z 2 \ 

4- -5 I dx dy dz, siendo S el solido limitado por el elipsoide 

1 . 

5. W + y 2 dxdydz, siendo S el solido formado por la hoja superior del cono 

s 

z 1 = x 1 + y 2 y el piano z = 1. 

En los ejercicios 6, 7, y 8, una integral triple JJJ fix, y, z) dx dy dz de una funcion 

S 

positiva se reduce a la integral reiterada dada. En cada caso dibujar la region de integration 
S mostrando su proyeccion sobre el piano xy. Expresar entonces la integral triple como una 
o mas integrales reiteradas en las que la primera integration se efectua respecto a y. 

6 - 

7 ' L(f&,y, *)dz~\ dy) dx. 

8 - mi +y f^ d ^ d y) dx - 

9. Demostrar que: 

/;(/;[/>-'] - w')*- 

Calcular las integrales de los ejercicios 10, 11 y 12 pasando a coordenadas cilmdricas. 
Puede suponerse la existencia de todas las integrales que se citan. 

10. JJJ (x 2 + y 2 ) dxdydz, siendo S el solido limitado por la superficie x 2 + y 2 = 2z 

s 

y el piano z = 2. 
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11 jj| dxdydz, siendo S el solido limitado por los tres pianos coordenados, la super- 

s 

ficie z = x 1 + y 1 , y el piano x + y = 1 . 

12 . JJJ (j 2 + z 2 ) dxdydz, siendo S un cono recto de revolucion, de altura h, base situa- 
s 

da en el piano xy y de radio a, y eje en el eje z. 

Calcular las integrales 13, 14, y 15 mediante la transformation a coordenadas esfericas. 

13. JJJ dx dy dz , siendo S una esfera de radio a y centro en el origen. 

g 

14 . JJJ dx dy dz, siendo S el solido limitado entre dos esferas concentricas de radios 
s 

a y b, (0 < a < b) y con centro en el origen. 

15. Iff [(•* - af + (y - bf + (z - cf]-' A dxdydz, siendo S una esfera de radio R y 

centro en el origen, y (a, b, c) es un punto fijo en el exterior de esa esfera. 

16. Se pueden definir unas coordenadas esfericas generalizadas mediante la aplicacion si- 
guiente: 

x = a P cos m 6sen n <p, y = b P sen m dsen n <p, z=cpcos n <p, 
donde a,b,c,m y n son constantes positivas. Demostrar que el jacobiano es igual a 

- abcmnp 2 cos ” 1-1 0 sen m - J 6 cos n_1 ^sen 2 "- 1 cp. 

Las integrales triples pueden emplearse para calcular volumenes, masas, centros de gra- 
vedad, momentos de inercia, y otros conceptos fisicos asociados a solidos. Si S es un solido su 
volumen V viene dado por la integral triple 

V = J [j" dxdy dz. 
s 

Si al solido se asigna una densidad fix, y, z) en cada uno de sus puntos (x,y , z) (masa por 
unidad de volumen), su masa M es: 

M = J J J f(x,y, z) dxdydz, 
s 

y su centro de gravedad el punto (x, y, z)con coordenadas 

X = JjJ xf(x, y, z) dx dy dz, 
s 

y con calculo parecido y y z. El momento de inercia L, respecto al piano xy se define por la 
igualdad 


4v = JJJ z 2 f(x,y,z) dxdydz 
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y formulas parecidas para /« e /„. El momento de inercia h respecto a una recta L se define 

como 

4 = J JJ 6 \x, y, z)f(x, y, z) dx dy dz, 
s 

donde &(x, y, z) represents la distancia de un punto generico de S a la recta L. 

17. Demostrar que los momentos de inercia respecto a los ejes coordenados son 

4 = IXV + 4z» 4 = lyx + lyt > 4 = Izx + 4» • 

18. Calcular el volumen de un solido limitado por encima por la esfera x 2 + y 2 + z 2 = 5 
y por debajo por el paraboloide x 2 + y 2 = 4z. 

19. Calcular el vol umen de u n solido limitado por el piano xy, el cilindro x 2 + y 2 = 2x, 
y el cono z = V x 2 + y 2 . 

20. Calcular la masa del solido limitado por dos esferas concentricas de radios a y b, 
(0 < a < b), si la densidad en cada punto es igual al cuadrado de su distancia al centro. 

21. Un cono circular recto homogeneo tiene altura h. Demostrar que la distancia de su cen- 
troide a la base es h/4. 

22. Determinar el centro de gravedad de un cono de altura h si su densidad en cada punto 
es proporcional a la distancia de ese punto a la base. 

23. Idem, suponiendo que la densidad en cada punto es proporcional a la distancia de ese 
punto al eje del cono. 

24. Un solido esta limitado por dos hemisferios concentricos de radios a y b, siendo 
0 < a < b. Si la densidad es constante, encontrar el centro de gravedad. 

25. Determinar el centro de gravedad de un cubo de lado h si su densidad en cada punto 
es proporcional al cuadrado de la distancia de ese punto a un vertice de la base. (Tomar 
la base en el piano xy y situar las aristas en los ejes coordenados.) 

26. Un cono recto de revolucion tiene altura h, radio en la base a, densidad constante, y 
masa M. Encontrar su momento de inercia respecto a un eje paralelo a la base y que 
pasa por el vertice. 

27. Calcular el momento de inercia de una esfera de radio R y masa M respecto a un dia- 
metro si la densidad es constante. 

28. Calcular el momento de inercia de un cilindro de radio a y masa M si su densidad en 
cada punto es proporcional a la distancia de ese punto al eje del cilindro. 

29. El tallo de una seta es un cilindro recto de revolucion de diametro 1 y longitud 2, y su 
cabeza es un hemisferio de radio R. Si la seta es un solido homogeneo con simetria 
axial, y su centro de gravedad esta situado en el piano en el que el tallo se une a la 
cabeza, calcular R. 

30. Un satelite artificial tiene una cubierta compuesta de porciones de dos cilindros de 
revolucion de igual diametro D cuyos ejes se cortan en angulo recto. Hay el proposito de 
transportar el satelite a Cabo Kennedy en una caja ctibica de interior D. Demostrar que 
una tercera parte del volumen de la caja se pierde. 

31. Designemos con S„(a) el siguiente conjunto del n-espacio, siendo a > 0: 


S n {a) — {Otj ,. . . , x n ) | Ia^I + • • • + \x n \ <, a}. 

Cuando n = 2 el conjunto es un cuadrado con vertices en (0, ±a) y (±a, 0). Cuando 
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n = 3 es un octaedro con vertices en (0,0, ±a), (0, ±a,0), y (±a, 0,0). Llamemos V„(a) 
al volumen de S„(a) dado por 

^n(«) = J • • • J dx x ■ ■ • dx n . 

S,(a) 


a) Demostrar que V„(a) = a”V„(l). 

b) Para n > 2, expresar la integral que da V„(l) como una iteracion de una integral 
uni-dimensional y una integral (n — l)-multiple y demostrar que 


v n (\) = K n _j(l) (1 - \x\Y~'dx = ? K^Cl). 


2 n a n 

c) Hacer uso de los apartados a) y b) para deducir que V„(a) = 

32. Designemos con S„(a) el siguiente conjunto del n-espacio, siendo a > 0 y n > 2: 

S„(a) = {(*1.*«) I l*il + \x n \ ^ a para cada / = 1. n - 1}. 

a) Esbozar un grafico de S„( 1) cuando n = 2 y cuando n = 3. 

b) Pongase V„(a) = J • • • J dx x ■ ■ ■ dx n , y demostrar que V„(a) = a n V„(l). 

S„(a) 

c) Expresar la integral que da V«(l) como una iteracion de una integral uni-dimensio¬ 
nal y una integral (n - 1)-multiple y deducir que V„(a) = 2 n a n \n . 

33. a) En relation con el ejemplo 4, pag. 502. Expresar la integral que da V„(l), (volumen 
de la esfera n-dimensional unidad) como la iteracion de una integral (n — l)-multiple 
y una integral uni-dimensional y con ello demostrar que 

K„(l) = 2K n ^(l) f (1 - x 2 )<"- 1)/2 dx. 

Jo 

b) Con el apartado a) y la ecuacion (11.52) deducir que 
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INTEGRALES DE SUPERFICIE 


12.1 Representation parametrica de una superficie 

Este capi'tulo trata de las integrales de superficie y sus aplicaciones. Puede 
imaginarse la integral de superficie como el equivalente en dos dimensiones a 
una integral de linea siendo la region de integration una superficie en lugar de 
una curva. Antes de estudiar las integrales de superficie, tenemos que ponernos 
de acuerdo en lo que es una superficie. 

Hablando sin precision, una superficie es el lugar de un punto que se mueve 
en el espacio con dos grados de libertad. En la parte de Geometria analitica del 
Volumen I vimos dos metodos para expresar anah'ticamente un tal lugar. Uno es 
la representation implicita en el que se considera una superficie como un conjunto 
de puntos (,v, y, z) que satisfacen una ecuacion de la forma F(x, y, z) = 0. Algu- 
nas veces podemos despejar en la ecuacion una de las coordenadas en funcion de 
las otras dos, por ejemplo z en funcion de x e y. Cuando eso es posible obtene- 
mos una representation explicita dada por una o varias ecuaciones de la forma 
z = f( X , y). Por ejemplo, una esfera de radio 1 y centra en el origen tiene la re¬ 
presentation implicita x 2 + y 2 + z 2 -1=0. A1 despejar z se obtienen dos solu- 
ciones, z = V 1 - x 2 — y 2 y z = - V1 — x 2 — y 2 . La primera es la represen¬ 
tation explicita de la semiesfera superior y la segunda la de la interior. 

Existe un tercer metodo de representation de superficies que es mas util en 
el estudio de las mismas; es la representation parametrica o vectorial por medio 
de tres ecuaciones que expresan x, y, z en funcion de dos parametros u y v: 

(12.1) x = X(u, v), y=Y(u,v), z = Z(u,v). 

Aqui el punto («, v) puede variar en un conjunto conexo bidimensional T en el 
piano uv, y los puntos (x, y, z) correspondientes constituyen una portion de super- 

509 
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fide en el espacio xyz. Este metodo es analogo al de la representacion de una curva 
en £ 3 mediante tres ecuaciones con un parametro. La presencia de los dos para- 
metros en (12.1) permite transmitir dos grados de libertad al punto (x, y, z), como 
sugiere la figura 12.1. Otro modo de expresar la misma idea consiste en decir que 
una superficie es la imagen de una region plana T por medio de la aplicacion defi- 
nida por (12.1). 

Si introducimos el radio vector r que une el origen a un punto generico 
(x, y, z) de la superficie, podemos combinar las tres ecuaciones parametricas (12.1) 


z 



Figura 12.1 Representacion parametrica de una superficie. 
en una ecuacion vectorial de la forma 

(12.2) r(u, v) = X{u, v)i + Y(u, v)j + Z(u, v)k, donde ( u,v)eT. 

Esta es la llamada ecuacion vectorial de la superficie. 

Existen, naturalmente, muchas representaciones parametricas de la misma su¬ 
perficie. Una de ellas puede obtenerse siempre a partir de la forma explfcita 
z = /(*. y) tomando X(u, v) = u, Y(u, v) = v, Z{u, v) = flu, v). Por otra parte, 
si es posible eliminar u y v en las ecuaciones parametricas —por ejemplo, si pode¬ 
mos resolver las dos primeras ecuaciones (12.1) respecto a u y v en. funcion de 
x e y y sustituimos en la tercera— obtenemos la representacion explfcita z = 
fix, y). 

ejemplo 1. Representacion parametrica de una esfera. Las tres ecuaciones 

(12.3) x = a cos u cos v, y = a senw cos v, z = asenv 
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Figura 12.2 Representation parametrica de una esjera. 


f .D C 

I... ..., i 

A B 





Figura 12.3 Deformacion de un rectangulo en un hemisjerio. 

representan una esfera de radio a y centra en el origen. Si elevamos al cuadrado. 
las tres ecuaciones (12.3) y sumamos resulta x 2 + y 2 + z 2 = a 2 , y vemos que todo 
punto (x, y, z) que satisface (12.3) esta en la esfera. Los parametros u y v en 
este ejemplo pueden interpretarse geometricamente como los angulos dibujados 
en la figura 12.2. Si hacemos que el punto (u, v) varie en el rectangulo 
T = [0, 2 tt] x[ —|t7-],1os puntos determinados por (12.3) describen toda la 
esfera. El hemisferio superior es la imagen del rectangulo [0, 2-] x [0, Ve 77 ! y 
el inferior es imagen de [0, 2-ir] X [ — V 2 77 , 0]. La figura 12.3 nos da una idea 
de como el rectangulo [0, 2?r] x [0, V2 77 ] es aplicado en el hemisferio superior. 
Imaginemos que el rectangulo es de un material plastico flexible capaz de estirarse 
o encogerse. La figura 12.3 muestra el rectangulo convertido por deformacion en 
un hemisferio. La base AB se transforma en el ecuador, los lados opuestos AD y 
BC se hacen coincidir, y el lado superior DC degenera en un punto (el polo 
Norte). 
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ejemplo 2. Representacion parametrica de un corn. La ecuacion vectorial 


r(u, v) = v sen a cos ui + v sen «sen uj + v cos a k 

representa el cono circular recto dibujado en la figura 12.4, donde a es el semi- 
angulo en el vertice. Tambien aqui, los parametros u, v, admiten interpretaciones 
geometricas; v es la distancia desde el vertice al punto (x, y, z) del cono, y u es 
el angulo polar. Cuando ( u , v) varfa en un rectangulo de la forma [0, 2 -] x 



D C 

A B 


Figlra 12.4 Representacion parametrica de un Figura 12.5 Deformation de un rectangulo 
cono. en un cono. 


[0, h], los correspondientes puntos ( x, y, z) describen un cono de altura h cos a. 
Un rectangulo plastico puede, por deformacion, convertirse en un cono haciendo 
coincidir los lados AD y BC, como indica la figura 12.5, y convirtiendo el lado 
AB en un punto (el vertice del cono). La superficie de la figura 12.5 muestra un 
estado intermedio de la deformacion. 

En el estudio general de las superficies, las funciones X,Y,yZ que aparecen 
en las ecuaciones parametricas (12.1) o en la ecuacion vectorial (12.2) se suponen 
continuas en T. La imagen de I a traves de la aplicacion r se llama superficie 
parametrica y se representara mediante el simbolo r(T). En muchos de los ejem- 
plos que comentaremos, T sera un rectangulo, un disco circular, o algun otro con- 
junto conexo simple limitado por una curva cerrada simple. Si la funcion r es 
uno a uno en T, la imagen r(T ) de denominara superficie parametrica simple. En 
tal caso, puntos distintos de T se aplican en puntos distintos de la superficie. 
En particular, toda curva cerrada simple en T se aplica en una curva cerrada sim¬ 
ple situada en la superficie. 

Una superficie parametrica r(T) puede degenerar en un punto o en una curva. 
Por ejemplo, si las tres funciones X, Y, Z son constantes, la imagen r(T) es un 
solo punto. Si X, Y y Z son independientes de v, la imagen r(T) es una curva. 
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Otro ejemplo de superficie degenerada se presenta cuando X(u, v) = u + v, 
Y(u, v) = (u + vf, y Z(u, v) = (u + vf, siendo T = [0, 1] X [0, 1]. Si es- 
cribimos t — u + v vemos que la superficie degenera en una curva alabeada de 
ecuaciones parametricas x = t, y = t 2 y z = t\ donde 0 ^ t ^ 2. Estos casos 
excepcionales pueden evitarse imponiendo ciertas restricciones a la funcion r que 
define la aplicacion, como se explica en la siguiente section. 

12.2 Producto vectorial fundamental 


Consideremos una superficie representada por la ecuacion vectorial 

r(u, v) = X(u, v)i + Y(u, v)j + Z(u, v)k , donde (, u, v) e T. 
Si X, Y, y Z son derivables en T podemos considerar los dos vectores 


y 


dr dX . , BY . , dZ, 
du . du du du 

dr dX . dY . dZ , 
dv dv dv dv 


El producto vectorial drldu x dridv se denominara producto vectorial fundamental 
de la representacion r. Sus componentes pueden expresarse como determinantes 
iacobianos. En efecto, tenemos, 


... . dr dr 
(12.4) — X - 
du dv 


i 

j 

k 


dY 

dZ 


dZ 

dX 


dJX 

dY 

dX 

dY 

dZ 


du 

du 


du 

du 


du 

du 

du 

du 

du 

= 

dY 

dZ 

i + 

dZ 

d_x 

j + 

dX 

d_Y 

dx 

dY 

dZ 


dv 

dv 


dv 

dv 


dv 

dv 

dv 

dv 

dv 











d(Y, Z) . | d(Z,X) | d(X, Y) } _ 
d(u, v ) d{u, v) d(u, v) 


Si (u, v) es un punto en T en el cual dr/du y drfdv son continuas y el pro¬ 
ducto vectorial fundamental no es nulo, el punto imagen r(u, v) se llama punto 
regular de r. Los puntos en los que no son continuas dr/du o dr I dv o bien 
dr/du x drfdv — O se llaman puntos singulares de r. Una superficie r(T) se llama 
regular si todos sus puntos son regulares. Toda superficie tiene mas de una repre- 
sentacion parametrica. Algunos de los ejemplos que luego se comentan ponen de 
manifiesto que un punto de una superficie puede ser regular para una represen- 
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z 



tacion y singular para otra. Seguidamente explicamos el significado geometrico de 
los conceptos de puntos regulares y singulares. 

Consideremos en T un segmento rectilfneo horizontal. Su imagen por r es 
una curva (llamada w-curva) situada en la superficie r{T). Para v fija, imagine- 
mos que el parametro u represente el tiempo. El vector dr/du es el vector velo- 
cidad de esta curva. Cuando u se incrementa en A u, un punto situado al princi- 
pio en r(w, v ) se desplaza a lo largo de una w-curva una distancia aproximada- 
mente igual a \\dr/du\\ Aw puesto que \\drjdu\\ represents la velocidad a lo largo 
de la «-curva. Analogamente, para u fija un punto de una v-curva se desplaza en 
el tiempo Ay una distancia aproximadamente igual a \\drldv\\ Ay. Un rectangulo 
en T que tenga un area Aw Ay se convierte en una porcion de r(T) que aproxi- 
maremos por un paralelogramo determinado por los vectores (dr/du) Aw y 
(dr/dv) Ay. (Ver figura 12.6.) El area del paralelogramo determinado por 
(dr/du) Aw y (dr/dv) Ay es el modulo de su producto vectorial 

dr . dr . dr dr . . 

— Aw x — Ay = — x — Aw Ay. 

du dv du dv 

Por consiguiente la longitud del producto vectorial fundamental puede imaginarse 
como un factor de proporcionalidad de las areas. En los puntos en los que este 
producto vectorial es nulo el paralelogramo degenera en una curva o en un punto. 
En cada punto regular los vectores dr/du y dr/dv determinan un piano que tiene 
el vector dr/du x dr/dv como normal. En la proxima section demostraremos 
que^ dr/du x dr/dv es normal a toda curva regular en la superficie; por esta 
razon el piano determinado por dr/du y dr/dv se llama piano tangente a la super- 



Producto vectorial fundamental 


515 


ficie. La continuidad de drjdu y dr/dv implica la continuidad de dr/du x dr/dv; 
esto. a su vez, significa que el piano tangente se mueve con continuidad en una 
superficie regular. Asi vemos que la continuidad de dr/du y dr/dv evita la pre- 
sencia de aristas o «puntas» en la superficie; la no anulacion de dr/du x dr/dv 
evita los casos degenerados antes citados. 

ejemplo 1. Superficies con representacion explicita, z = f(x, y). Para una 
superficie con una representacion explicita de la forma z = f(x, y), podemos usar 
x e y como parametros, lo que nos da la ecuacion vectorial 


r(x, y) = xi + yj + f(x, y)k. 

Esta representacion nos da siempre una superficie parametrica simple. La region T 
se denomina proyeccion de la superficie sobre el piano xy. (En la figura 12.7 se 
muestra un ejemplo.) Para calcular el producto vectorial fundamental observe- 
mos que 


d X-i+ d J-k 

dx dx 


y 




si / es diferenciable. Esto nos da 


(12.5) 


i j k 


dr dr _ 1 

dx dy 


0 


0 1 


d l 

dx 

d l 

dy 


df . df 
zri - -r-J +k. 
dx ay 


Puesto que el componente z de dr/dx x dr/dy es 1, el producto vectorial funda¬ 
mental nunca es cero. Luego los unicos puntos singulares que pueden presen- 
tarse por esta representacion son puntos en los que al menos una de las deriva- 

das parciales df/dx o dfjdy no es continua.___ 

Un caso tipico es la ecuacion z = % 1 — x 2 — y 2 , que representa un hemis- 
ferio de radio 1 y centro en el origen, si x 2 + y 2 — 1. La ecuacion vectorial 


r(x, y) = xi + yj + V1 — x 2 — y 2 k 

aplica el disco unidad T = {(x, y) ' x 2 + y 2 - 1} sobre el hemisferio y dicha apli- 
cacion es uno a uno. Las derivadas parciales dr/dx y dr/dy existen y son conti- 
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nuas en todo el interior del disco, pero no existen en la periferia. Por consiguiente, 
todo punto del ecuador es un punto singular de esta representacion. 

ejemplo 2. Consideremos el mismo hemisferio del ejemplo anterior, pero 
esta vez como imagen del rectangulo T — [0, 2tt] x [0, V 2 ~] a traves de la apli- 
cacion 


r(u, v) — a cos u cos v i + a sen u cos vj + a sen v k. 

Los vectores dr/du y dr/dv vienen dados por las formulas 

dr 

— = — a sen u cos vi + a cos u cos vj , 
du 


— = — a cos u sen v i — a sin u sen vj + a cos vk. 
dv 

Un sencillo calculo muestra que su producto vectorial es igual a 

dr dr 

— x — = a cos v r(u, v). 
du dv 

La imagen de T no es una superficie parametrica simple a causa de que esta apli- 
cacion no es uno a uno en T. En efecto, todo punto del segmento rectilfneo 
v = i Zjtt, 0 — u — 2~ se aplica en el punto (0, 0, a) (el polo Norte). Tambien, por 
la periodicidad del seno y coseno, r toma los mismos valores en los puntos (0, v) 
y (2-, v), de modo que los lados izquierdo y derecho de T se aplican en la misma 
curva, que es un arco que une el polo Norte al punto (a, 0, 0) del ecuador. (Vease 
figura 12.3.) Los vectores dr/du y dr/dv son continuos en todo T. Puesto que 
l ; dr/du X dr/dv = a 2 cos v,los unicos puntos singulares de esta representacion 
se presentan cuando cos v — 0. No hay otro punto singular que el polo Norte. 

12.3 El producto vectorial fundamental, considerado como una normal a la 
superficie 

Consideremos una superficie parametrica regular r(T), y sea C* una curva 
regular en T. La imagen C = r(C*) es entonces una curva regular situada en la 
superficie. Demostraremos que en cada punto de C el vector dr/du X dr/dv es 
normal a C, como se ve en la figura 12.6. 

Supongamos que C* esta descrita por una funcion a definida en un intervalo 
[a, b], por ejemplo sea 


«(0 = U(t)i + v(t)j. 
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Entonces la imagen de la curva C esta representada por la funcion compuesta 

P(0 = r[«(0] = X[«(0V + Y[a(t)]j+ Z[a(t))k. 

Queremos demostrar que la derivada p'(f) es perpendicular al vector dr/du X 
dr/dv cuando las derivadas parciales dr/du y dr/dv estan calculadas en (U(t), 
V(t)). Para calcular p'(t) derivamos cada componente de p(f) mediante la regia 
de la cadena (teorema 8.8) para obtener 

(12.6) p'(0 = VX • a'(t)i + V Y ■ a'(t)j + VZ • a'(0* , 

donde los vectores gradientes V X, V Y, y VZ estan calculados en (U(t), V(t)). 
La ecuacion (12.6) puede escribirse en la forma 

P'(0 = y V\ 0 + V\i), 

ou o v 

estando calculadas las derivadas dr/du y dr/dv en (1/(0, V(0)> Ya que drldu y 
dr/dv son perpendiculares en cada punto al producto vectorial dr/du X dr/dv , lo 
mismo ocurre con p'(0- Esto demuestra que drldu X drjdv es normal a C, como 
queriamos probar. Por esta razon, el vector dr/du X drjdv se denomina normal 
a la superficie r{T). En cada punto regular P de r(T) el vector dr/du X dr/dv es 
distinto de cero; el piano que pasa por P y tiene este vector como normal se llama 
piano tangente a la superficie en P. 

12.4 Ejercicios 


En los ejercicios del 1 al 6, eliminar los parametros u y v para obtener la ecuacion 
cartesiana, probando asi que la ecuacion vectorial dada representa la superficie que se cita. 
Calcular tambien el producto vectorial fundamental dr/du x dr/dv en funcion de u y v. 

1. Plano: 

r{u, v) = (x 0 + a x u + + (y„ + a 2 u + b 2 v)j + (z 0 + a 3 u + 6 3 r)fc. 

2. Paraboloide eliptico: 

r(u, v ) = au cos v i + bu sen vj + u z k. 

3. Elipsoide: 

r(u, v) = a sen « cos v i + b sen u sen vj + c cos u k. 

4. Superficie de revolucidn: 

r(u, v) = u cos v i + u sen vj + f(u)k. 

5. Cilindro: 

r(u, t>) = ui + a sen vj + a cos v k. 

6. T oro: 

r(u, v) = (a + b cos u) sen v i + (a + b cos u) cos vj + b sen uk, donde 0 < b < a. 
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iCual es el significado geometrico de a y b ? 

En los ejercicios 7 al 10 calcular la magnitud del producto vectorial fundamental 
en funcion de u y v. 

1. r(u, v ) = a sen u cosh v i + b cos u cosh vj + csenh v k. 

8. r(u, v) = (u + v)i + (« — v)j + 4v 2 k. 

9. r(u, v) = (m + v)i + (« 2 + v 2 )j + (« 3 + v 3 )k . . 

10. r(«, v) = u cos v i + u sen vj + |« 2 .sen 2v k. 

12.5 Area de una superficie parametrica 

Sea S = r{T) una superficie parametrica representada por la funcion r defi- 
nida en una region T del piano uv. En la seccion 12.2 vimos que la longitud del 
producto vectorial fundamental dr/du X dr/dv puede interpretarse como un fac¬ 
tor de proporcionalidad de areas. (Vease figura 12.6) Un rectangulo en T de area 
A u Ay es aplicado por r sobre un paralelogramo curvilfneo en S con area apro- 
ximadamente igual a 


dr dr 
du X dv 


A u Av. 


Esta observacion sugiere la siguiente definicion. 

DEFIN1CION DE AREA DE UNA SUPERFICIE PARAMETRICA. El area de S, que 

representamos por a (S), se define por la integral doble 


(12.7) 



dr dr 

— x — 
du dv 


du dv. 


Dicho de otro modo, para determinar el area de S calculamos primero el pro¬ 
ducto vectorial fundamental drfdu X dr/dv e integramos entonces su longitud en 
la region T. Cuando dr/du X dr/dv esta expresado en funcion de sus componen- 
tes, por medio de la ecuacion (12.4), tenemos, 


( 12 . 8 ) 


a(S) = 


ff mXiM + ( d ( z < *n 2 + y y f 

y ^ \d(u, v)] \ d(u, v)J \ d(u, v) ) 


du dv. 


Escrita en esta forma, la integral para el area de una superficie se parece a la inte- 
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gral usada para calcular la longitud de un arco de curva.(*) 

Si S viene dada expli'citamente por una ecuacion de la forma z = f(x, y) po- 
demos usar x e y como parametros. El producto vectorial fundamental es el de la 
ecuacion (12.5), de este modo tenemos: 


dr dr_ 
dx By 


3f . df . , . 

-— /- -j+k 

dx dy 



En este caso, la integral para calcular el area de la superficie toma la forma: 


(12.9) 


ais)= i\j' + (£j + {j-j dxdy ' 

T 


donde la region T es ahora la proyeccion de S en el piano xy, como se ve en la 
figura 12.7. 


z 



Figura 12.7 Superficie S cun una representation explicila, z = fix, y). La region T es la 

proyeccion de S sobre el piano xy. 

(*) Puesto que en la integral (12.7) interviene r, el area de una superficie dependera de 
la funcion utilizada para representar la superficie. Cuando comentemos las integrales de 
superficie demostraremos (en la seccion 12.8) que bajo ciertas condiciones generales el area es 
independiente de la representacion parametrica. El resultado es analogo al del teorema 10.1, en 
el que se discutio la invariancia de las integrales de lfnea frente a un cambio de parametro. 
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Cuando S esta en un piano paralelo al piano xy, la funcion / es constante, de 
modo que dfjdx = df\dy = 0, y la ecuacion (12.9) se convierte en: 

a(S) — j j dx dy. 

T 

Que coincide con la formula corriente para el calculo de areas de regiones planas. 

La ecuacion (12.9) puede escribirse en otra forma que nos hace comprender 
mejor su significado geometrico. En cada punto de S, sea y el angulo formado por 
el vector normal N = dr/dx x dr/dy y el vector unitario coordenado k. (Vease 
figura 12.8.) Puesto que el componente z de N es 1, tenemos: 


N-k 

cos y — - 

IWI 11*11 


1 

IWI 


1 

dr dr 

dx dy 


y por tanto, || dr/dx X dr/dy ||= 1/cosy. Por consiguiente, la ecuacion (12.9) 
toma la forma: 


(12.10) a(S) = \ \ -1—dx dy. 

cos y 
t ' 

Supongamos ahora que S esta en un piano no perpendicular al piano xy. En 
tal caso y es constante y la ecuacion (12.10) establece que area de S = (area 
de T)/ cos y, o que 

( 12 . 11 ) 



dr dr 

Ficlim 12.8 La lonnitud de — x — es 1 /cos y. Figura 12.9 La regia del coseno para 

x y un rectangulo. 
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La ecuacion (12.11) se denomina algunas veces regia del coseno. Nos dice que 
si una region S de un piano se proyecta en una region T de otro piano, que forma 
un angulo y con el primero, el area de T es igual al producto de cos y por el area 
de S. Esta formula es evidentemente cierta cuando S es el rectangulo dibujado en 
la figura 12.9, pues las distancias en una direccion quedan reducidas por el factor 
cos y mientras que las de direccion perpendicular no se alteran en la proyeccion. 
La ecuacion (12.11) extiende esta propiedad a cualquier region plana S. 

Supongamos ahora que S viene dada implicitamente por la ecuacion 
Fix, y, z) = 0. Si S puede proyectarse en forma uno a uno sobre el piano xy, la 
ecuacion Fix, y,z)= 0 define z como funcion de x e y, sea esta z = fix, y), y las 
derivadas parciales dffdx y df/dy estan relacionadas con las de F mediante las 
ecuaciones 


df dFfdx df dF/dy 

dx dF/dz ^ dy dFfdz 

en los puntos en los que dF/dz ¥= 0. Sustituyendo esos cocientes en (12.9), encon- 
tramos: 


( 12 . 12 ) 



JjdF/dxf + (dF/dy ) 2 + idFfd~zf 
| dFfdz | 


dx dy. 


ejemplo 1. Area de un hemisferio. Consideremos un hemisferio S de radio a 
y centro en el origen. Disponemos de la representacion implfcita x 2 +y 2 + z 2 — a 2 , 
z ^ 0; la explfcita z = V a? — x 2 —~y r ; y la parametrica 

(12.13) r(w, v) = a cos u cos vi + a sen u cos v j + a sent) k. 

Para calcular el area de S a partir de la representacion implicita utilizaremos 
la formula (12.12) tomando 


F(x, y, z) — x 2 + y* + z 2 — a 2 . 

Las derivadas parciales de F son dF/dx = 2x, dF/dy = 2 y, dF/dz = 2z. El hemis¬ 
ferio S se proyecta en forma uno a uno sobre el disco D = {(x, y)\x 2 + y 2 < a 2 } 
en el piano xy. No podemos aplicar la formula (12.12) directamente porque la 
derivada dF/dz es nula en la frontera de D. No obstante, dicha derivada no es 
nula en todo punto interior de D, de modo que podemos considerar un disco me- 
nor concentrico DiR) de radio R, siendo R < a. Si SiR) representa la porcion 
correspondiente del hemisferio superior, la (12.12) es ahora aplicable y resulta: 
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area de S(R ) 


_ ff V(2. 

J « 


:x) 2 + {2yf + (2z) 2 


D(R) 


|2z| 

-ffljxjy-ajj 


dx dy 
1 


Va 2 — x 2 — y 


c/x dy. 


D(R) nut) 

La ultima integral puede calcularse facilmenle en coordenadas polares, obteniendo: 


rZir r- f*R i -i _ 

area de S(R ) = a \ —z.. r dr dO = 27ra(a - sja 2 - R z ). 

jo LJo Va 2 - r 2 J 


Cuando R a resulta como lfmite 2 tt a 2 . 

Puede eludirse el paso al lfmite en el calculo precedente empleando la re¬ 
presentation parametrica (12.13). Los calculos del ejemplo 2 de la seccion 12.2 
muestran que 


dr dr 

— x — 
du dv 


= ||a cos vr(u, «)|| = a 2 |cos v\. 


Por lo tanto, podemos aplicar la formula (12.7), tomando como region T el rec- 
tangulo [0,2-] X [0, Jw], Obtenemos: 

a(S) = a 2 JJ" |cos r| du dv = a 2 Qj^eos v dp] du = 2na 2 . 

T 

ejemplo 2. Otro teorema de Pappus. Uno de los teoremas de Pappus esta- 
blece que una superficie de revolucion, obtenida por la rotacion de una curva 
plana de longitud L alrededor de un eje situado en el piano de la curva, tiene por 
area 2-Lh siendo h la distancia desde el centro de gravedad de la curva al eje 
de rotacion. Usaremos la formula (12.7) para demostrar este teorema en un caso 
especial de superficie de revolucion. 

Supongamos una curva C, inicialmente en el piano xz, que gira alrededor del 
eje z. Sea z = f(x), su ecuacion en el piano xz, donde a < x ^ b, a > 0. La super¬ 
ficie de revolucion S asf engendrada puede representarse por la ecuacion vectorial 


r(u, v) = u cos v i + u sen vj + f{u)k , 

donde ( u , v) e [a, 6] X [0, 2?r]. Los parametros u y v pueden interpretarse como 
el radio y angulo polares, como se ve en la figura 12.10. Si a < u ^ b, todos los 
puntos (x, y, z) situados a una misma distancia u del eje z, tienen la misma coor- 
denada z,/(«), de manera que estan todos en la superficie. El producto vectorial 
fundamental de esta representation es: 
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z 



Figura 12.10 Area de una superjicie de revolucion determinada mediante el teorema 

de Pappus. 


i j k 

cos V sen v f'(u ) = —uf'(u) cos v i — uf(u) sen vj + uk, 

—u sen v u cos v 0 

y por tanto, 

= «>/l + [/'(«)?. 

du dv 

Por consiguiente, la formula (12.7) se convierte en: 

«(S) = J 0 2T [f «Vl + u\u)f du ] dv = 277 £ uvr+17w rfu. 

La integral que resulta puede expresarse como fcxds, que es una integral de 
linea respecto a la longitud del arco tomada a lo largo de C. Como tal, vale xL, 
donde x es la coordenada x del centra de gravedad de C y L la longitud de C. 
(Vease seccion 10.8.) Luego el area de S es 2rrLx. Esto demuestra el teorema de 
Pappus en la superficie del ejemplo considerado. 


dr 3r 

— x — 
du dv 
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12.6 Ejercicios 


1. Sea S un paralelogramo de lados no paralelos a ningun eje coordenado. Sean Si, S 2 y S 3 
las areas d e las proy ecciones de S sobre los pianos coordenados. Demostrar que el area 
de S e Sy /s* + S 2 + S|. 

2. Calcular el area de la region que en el piano x -f y + z = a determina el cilindro 
x'- + y- = a-. 

3. Calcular el area de la porcion de esfera x- + y- + z- = a 2 interior al cilindro 
x- + y- = ay, siendo a > 0 . 

4. Calcular el area de la porcion de superficie z- = 2xy que se proyecta en el primer 
cuadrante del piano xy y limitada por los pianos x = 2 e y = 1 . 

5. Dada una superficie S de ecuacion vectorial 

r(u, v) — u cos v i + u sen vj + u 2 k, 
donde 0 < « < 4 y 0 < v < 2 tt. 

a) Demostrar que S es una porcion de cuadrica. Identificar dicha cuadrica, dibujarla 
e indicar el significado geometrico de los parametros u y v en la superficie. 

b) Calcular el producto vectorial fundamental dr/ du X dr/dv en funcion de u y v. 

c) El area de S es 77(65 V 65 — l)/n, donde n es entero. Calcular el valor de n. 

6 . Calcular el area de la porcion de superficie conica x- + y 2 = z 2 situada por encima del 
piano xy y limitada por la esfera x 2 -f y 2 -f z 2 = 2 ax. 

1. Calcular el area de la porcion de superficie conica x- + y 2 = z 2 situada entre los 
dos pianos z = 0 y x + 2z = 3. 

8 . Calcular el area de la porcion de paraboloide x 2 + y 2 — 2ay cortada por el piano y — a. 

9. Calcular el area del toro de ecuacion vectorial 

r(u, v ) = {a + b cos «)sen v i + (a + b cos u) cos vj + b sen u k, 

donde 0 < b < a y 0<w< 2 t 7 , 0 < v < 2tt. Utilizar el teorema de Pappus para com- 
probar el resultado. 

10. Una esfera esta inscrita en un cilindro circular recto. La esfera es cortada por dos pianos 
paralelos perpendiculares al eje del cilindro. Demostrar que las porciones de la esfera 
y del cilindro comprendidas entre esos dos pianos tienen la misma area. 

11. Sea T el disco unidad en el piano uv, T = {(u, v) u 2 + i ’ 2 < 1}, y pongamos 


r(u, v ) 


2 u 

u* +v* + 1 ' + 


2v 

u 2 + V 2 + l j + 


U 2 + V 2 - 1 
U 2 + V 2 + 1 


k. 


a) Determinar la imagen por r de cada uno de los siguientes conjuntos: la circunferen- 
cia unidad u- + v 2 = 1; el intervalo — 1 < u < 1; la parte de la recta u = v situada 
en T. 

b) La superficie S = r(J)es muy conocida. Decir cual es y dibujarla. 

c) Determinar la imagen por r del piano uv. Indicar con un grafico en el espacio xyz los 
significados geometricos de los parametros u y v. 
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12.7 Integrates de superficie 

En muchos aspectos, las integrales de superficie son analogas a las integrales 
de linea. Definimos las integrales de lfnea mediante una representacion parame- 
trica de la curva. Analogamente, definiremos las integrales de superficie en fun- 
cion de una representacion parametrica de la superficie. Demostraremos luego 
que en ciertas condiciones generales el valor de la integral es independiente de la 
representacion. 

definicion de integral de superficie. Sea S = r (T) una superficie pa¬ 
rametrica descrita por una funcion diferenciable r definida en una region T del 
piano uv, y sea f un campo escalar dejinido y acotado en S. La integral de super¬ 
ficie de f sobre S se representa con el simbolo JJ f dS [o por JJ fix, y, z) dS], 
y esta definida por la ecuacion r(T) s 


(12.14) 


IT/ dS = 

(T f[r(u,v)] 

dr 

dr 

x — 

JJ 

r(T) 

JJ 

T 

du 

dv 


siempre que exista la integral doble del segundo miembro. 

Los ejemplos que siguen ilustran algunas aplicaciones de las integrales de 
superficie. 

ejemplo 1. Area de una superficie. Cuando / = 1, la ecuacion (12.14) se 
transforma en 



du dv. 


La integral doble del segundo miembro es la que se uso en la seccion 12.5 para 
definir el area de una superficie. Asi pues, el area de S es igual a la integral de 
superficie JJ dS. Por este motivo, el simbolo dS se llama algunas veces «elemento 

r(T) 

de area de la superficie», y la integral de superficie JJ / dS se lee integral de / 

HT) 

respecto al elemento de area, extendida a la superficie r(T). 

ejemplo 2. Centro de gravedad. Momento de inercia. Si el campo escalar / 
se interpreta como la densidad (masa por unidad de area) de una lamina delgada 
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adaptada a la superficie S, la masa total m de la superficie se define por la formula 

m = y, z) dS. 

s 

Su centro de gravedad es el punto (Jc, y, z) determinado por las formulas 

xm = jjxf(x, y, z)dS, ym = j J yf(x, y, z) dS , zm = J j zf(x, y, z) dS. 
s s s 

El momento de inercia I L de S alrededor de un eje L viene dado por 

/i = / J &\x, y, z)f(x, y, z) dS , 
s 

donde 8(x, y, z) representa la distancia de un punto generico (x, y, z) de S a la 
recta L. 

Como ejemplo, determinemos el centro de gravedad de la superficie de una 
semiesfera uniforme de radio a. Utilicemos la representacion parametrica 

r(w, v) = a cos u cos v i + a sen u cos vj + a sen v k, 

en la que ( u, v) e [0, 2n] X [O.Jir]. Esta representacion ya fue discutida en el 
ejemplo 2 de la seccion 12.2, donde encontramos que la magnitud del producto 
vectorial fundamental es a 2 |cosvj. En este ejemplo la densidad f es constante, 
pongamos / = c, y la masa m es 2 t ra 2 c, c veces el area de S. Debido a la sime- 
tria, las coordenadas x e y del centro de gravedad son 0. La coordenada z viene 
dada por 


zm — c f f z dS = c j j a sen v • a 2 |cos a| du dv 


s T 

i'trl 2 


% 1T 

JO 


= 2na*c | sen v cos v dv = na 3 c = - m. 

2 


de modo que z = a/2. 

ejemplo 3. Flujo de fluido a traves de una superficie. Imaginemos que 
un fluido es una coleccion de puntos llamados particulas. A cada partfcula (x, y, z) 
asignamos un vector V (x, y, z) que representa su velocidad. Este es el campo de 
velocidad de la corriente. El campo de velocidad puede o no cambiar con el tiem- 
po. Consideraremos tan solo corrientes estacionarias, esto es, corrientes para las 
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que la velocidad V (x, y, z ) depende unicamente de la position de la parti'cula y no 
del tiempo. 

Designemos con p(x, y, z) la densidad (masa por unidad de volumen) del 
fluido en el punto (x, y, z). Si el fluido es incompresible la dentidad p sera cons- 
tante en todo el fluido. Para un fluido compresible, tal como un gas, la densidad 
puede variar de un punto a otro. En cualquier caso, la densidad es un campo 
escalar asociado a la corriente. El producto de la densidad por la velocidad la re- 
presentamos por F ; esto es, 


F(x, y, z) = p(x, y, z)V(x, y, z). 


Este es un campo vectorial llamado densidad de flujo de la corriente. El vector 
F(x,y,z) tiene la misma direccion que la velocidad, y su longitud tiene las di- 
mensiones 

masa distancia masa 

unidad de volumen unidad de tiempo (unidad de area)(unidad de tiempo) 


Dicho de otro modo, el vector densidad de flujo F (x, y, z) nos dice cuanta masa 
de fluido circula por el punto (x, y, z) en la direccion de V (x, y, z), por unidad de 
area y de tiempo. 

Sea S — r(T ) una superficie parametrica simple. En cada punto regular de 
S designemos con n el vector unitario normal que tenga el mismo sentido que 
el producto vectorial fundamental. Esto es, 


(12.15) 


dr dr 

du dv 
dr_ dr 
du dv 


El producto escalar F • n representa el componente del vector densidad de flujo 
en la direccion de n. La masa de fluido que pasa a traves de S en la unidad de 
tiempo en la direccion de n se define con la integral de superficie 


f f F ■ n dS = 1 

( F n 

dr dr 
— x — 

JJ J 

J 

du dv 


riT) 


du dv. 


12.8 Cambio de representation parametrica 

Volvamos nuevamente a la discusion de la independencia de las integrales de 
superficie de los cambios de representacion parametrica. Supongamos que una 
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funcion r aplica una region A del piano uv sobre una superficie parametrica r(A). 
Supongamos tambien que A es la imagen de una region B del piano st a traves de 
una aplicacion uno a uno derivable con continuidad G dada por 

(12.16) G(s, t) = U(s, t)i + V(s, t)j si (s, t)e B. 

Consideremos la funcion R definida en B mediante la ecuacion 

(12.17) R ( s ’0 — r [ G ( 5 > 0] • 

(Vease figura 12.11.) Dos funciones r y R asi relacionadas se denominaran regu¬ 
lar men te equivalentes. Funciones regularmente equivalentes representan la misma 
superficie. Esto es, r(A) y R(B) como conjuntos de puntos son identicos. (Esto 
resulta inmediatamente del hecho de ser G uno a uno.) El siguiente teorema trata 
de la relacion entre sus productos vectoriales fundamentales. 


z 



Figura 12.11 Dos representuciones parametricas de la misma superficie. 


teorema 12.1. Sean r y R dos funciones regularmente equivalentes ligadas 
por la ecuacion (12.17), donde G = Ui + Vj es una aplicacion, uno a uno y deri¬ 
vable con continuidad, de una region B del piano st sobre una region A del piano 
uv dada por la ecuacion (12.16). Tenemos entonces 

3* 3JJ /3r dr\ d( U, V) 
ds dt dv) d(s, t) 


(12.18) 
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donde las derivadas parciales dr/du y drjdv estan calculadas en el punto ( U(s,t ), 
V(s, t)). Dicho de otro modo, el producto vectorial fundamental de R es igual al 
de r, multiplicado por el determinante jacobiano de la aplicacion G. 

Demostracion. Las derivadas dR/ds y dR/dt pueden calcularse por deriva¬ 
tion de (12.17). Si aplicamos la regia de la cadena (teorema 8.8) a cada compo- 
nente de R y reordenamos los terminos, encontramos que 


dR_fodU drdV dR _ fcd_U drdV_ 

ds du ds dv ds ^ dt du dt dv dt 

donde las derivadas dr/du y dr/dv estan calculadas en ( U(s, t), V(s, t)). Multipli- 
cando vectorialmente esas dos ecuaciones obtenemos: 

dR 3/?_/3r 3r\ (dU dV_ _ dU dV\ (d_r_ dr\ d(U, V) 

ds dt \3u dv) \ ds dt dt ds / \3u dv) d(s, t) 

Como querfamos demostrar. 

La invariancia de las integrales de superficie frente a las representaciones para- 
metricas regularmente equivalentes resulta ahora como consecuencia inmediata 
del teorema 12.1. 


teorema 12.2. Si r y R son dos funciones regularmente equivalentes, 
como las descritas en el teorema 12.1 y si la integral de superficie Jf f ds existe, 

entonces tambien existe j | f ds y tenemos r(A> 

R(B) 

fj/ds-Sf/ds. 

r(A) R(Ii) 


Demostracion. Segun la definicion de integral de superficie tenemos 


JJ/dS = jjf[r(u,v)} 

r(A) A 


dr dr 

du dv 


du dv. 


Utilicemos ahora la aplicacion G del teorema 12.1 para transformar esa integral 
en una integral doble extendida a la region B del piano st. La formula de trans- 
formacion de las integrales dobles establece que 



dr dr 

— x — 
du dv 


du dv 


J «. 


f{r[G(s, »)]J 


dr dr 

du dv 


d(U, V) 
d(s, t) 


ds dt, 




530 


Integrates de superficie 


en donde las derivadas dr/du y dr/dv del segundo miembro estan calculadas en 
(U(s,t), V(s,t)). En virtud de la ecuacion (12.18), la integral sobre B es igual al 



dR dR 

ds dt 


els dt. 


Esto es la definicion de la integral de superficie JJ f dS. Con lo cual queda 
completa la demostracion. * (/<> 

12.9 Otras notaciones para las integrales de superficie 

Si S — r(T) es una superficie parametrica, el producto vectorial fundamental 
N = drjdu X dr/dv es normal a S en cada punto regular de la superficie. En cada 
uno de tales puntos existen dos vectores normales unitarios, uno n x que tiene la 
misma direccion que N, y otro « 2 que tiene direccion apuesta. Asi pues, 


N 

IWI 


y n 2 = -n 1 . 


Sea n una de las dos normales n x 6 n 2 . Sea F un campo vectorial definido en S 
y supongamos que la integral de superficie J’J' F • n dS exista. Podemos entonces 
escribir * 


(12.19) 


n dS — J 

T 

-4 


F[r(u, t>)] • n(u, v) 


dr dr 
— x — 
du dv 


du dv 


F[r(u, y)] • — X — du dv, 
du dv 


donde el signo + se usa si n = n x y el signo — si n = n 2 . 

Supongamos ahora que expresamos F y r en funcion de sus coordenadas, 


y 


F(x, y, z) = P(x, y, z)i + Q(x, y, z)j + R(x, y, z)k 


r{u, v ) = X(u, v)i + Y(u, v)j + Z{u, v)k. 

El producto vectorial fundamental de r viene entonces dado por 

= d -L x in = d(Y ’ Z) i + d ( z ’ x h + d(x ' y ) k 

du dv d(u, v) d(u, v ) d(u, v ) 
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Si n = w 1( la ecuacion (12.19) se transforma en 


F ■ ndS = I P[r(u, »)] du dv 

JJ JJ d(u. v) 


(12.20) 


+ 


JJ 


d(u, v) 

2tK«, t03 g - (Z ’ du dv + 
o(u, V) 


JJ 


R[r( u , v )]^J)du dv, 
d(u, v) 


si n = n 2 , cada una de las integrales dobles del segundo miembro debe reempla- 
zarse por su opuesta. Frecuentemente la suma de las integrales dobles del segundo 
miembro se escribe mas brevemente poniendo 


j J P(x, y,z)dy Adz + jj Q(x, y, z) dz A dx + JJ R(x, y, z) dx A dy, 

(12.2lf S S 

o aun con mayor simplicidad 

(12.22) J J P dy A dz + Q dz A dx + R dx A dy. 
s 

Las integrales que aparecen en (12.21) y (12.22) pueden expresarse como inte¬ 
grales de superficie. Asi, por ejemplo, la integral de superficie // P dy A dz esta 
definida por la ecuacion s 

(12.23) JJ P dy A dz = JJ P[r(u, a)] du dv. 


Esta notacidn esta sugerida por la formula del cambio de variables en una integral 
doble. 

A pesar del parecido en la notacion, la integral del primer miembro de (12.23) 
no es una integral doble. Ante todo, P es una funcion de tres variables. Debemos 
tambien tener en cuenta el orden en el que aparecen los simbolos dy y dz en la 
integral de superficie, debido a que 

d(Y, Z) _ _ d(Z, Y) 

d(u,v) d(u,v) i 

jjpdy Adz = -JJ P dz A dy. 

s s 


y por tanto, 
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Con tal notation, la formula (12.20) se puede escribir: 

(12.24) JJ F ■ n dS = JJ P dy A dz + Q dz A dx + R dx A dy 

s s 

si ji = iij. Si n — h 2 la integral de! segundo miembro debe reemplazarse por su 
opuesta. Esta formula se parece a la de las integrales de li'nea: 

j c F ■ da = P dx + Q dy + R dz. 

Si el vector normal unitario n se expresa en funcion de sus cosenos directores, 
n = cos a i + cos /?/ + cos y k , 

entonces F ■ n — P cos a + Q cos /3 + R cos y, y podemos escribir 

J/F-i.dS-//(P cos a + Q cos /S + JR cos y) dS. 
s s 

Esta ecuacion es valida tanto si n = come si n = n 2 . Los cosenos directores de- 
penderan de la eleccion de la normal. Si n = n x podemos utilizar (12.24) para 
escribir 

(12.25) 

JJ (P cos a + Q cos + R cos y) dS — JJ P dy A dz + Q dz A dx + R dx A dy. 
s s 

Si, en cambio, n = n 2 , tenemos 

(12.26) 

JJ (P cos a + <2 cos /? + R cos y) dS = — JJ P dy A dz + Q dz A dx + R dx A dy 
S s 

12.10 Ejercicios 

1. Sea S la semiesfera x 2 + y 2 + z 2 =\, z>0, y F(x, y, z)=xi+yj. Sea n el vector normal 
unitario exterior a S. Calcular el valor de la integral de superficie Jf F n dS, empleando: 

s 

a) la representacion vectorial r(«, p ) - sen u cos v i + sen u sen v j + cos u k , 

b) la representacion explicita z _ 
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2. Demostrar que el momento de inercia de un recipiente esferico alrededor de un dia- 
metro es igual a f ma-, siendo m la masa del recipiente y a su radio. 

3. Hallar el centre de gravedad de la porcion de superficie esferica homogenea 
x- + y- + z- = a- situada sobre el primer cuadrante del piano xy. 

4. Sea S la porcion de piano limitada por un triangulo de vertices (1,0,0),(0,1,0), y 

(0,0, 1), y seaF(x, y, z) = xi + yj 4- zk .Representamos con n la normal unitaria a S 
que tiene componente z no negativa. Calcular la integral de superficie JJF n dS 
utilizando: • s ' 

a) la representacion vectorial r(u, v) — ( u + v)i + ( u — v)j + (1 — 2u)k, 

b) una representacion expllcita de la forma z = j(x, y). 

5. Sea S una superficie parametrica dada en la forma explicita z = f(x, y), donde (x, y) 
vari'a en una region plana T, proyeccion de S en el piano xy. Sean F -Pi -f Qj + Rk 
y n la normal unitaria a S de componente z no negativa. Emplear la representacion para¬ 
metrica r(x, y) = xi + yj +f(x,y)k y demostrar que 

& T 


donde P, Q y R estan calculadas en (x, y, f(x, y)). 

6 . Sea S la misma superficie del ejercicio 5, y sea 95 un campo escalar. Demostrar que 


a) jj ^ x ^' z)dS = jj Vlx,y,f( x ,y)]^\ + dxdy. 

■S T 

b) jj ?(x,y, z)dy a dz = - JJ <p[x, y,f(x,y)] dx dy. 

•s T 

e) Jj <f(x,y,z)dz \dx = - JJ <p[x, y,f(x, y)]-^dx dy. 

S T 

7. Si S es la superficie de la esfera x 2 ■+ y 2 + z 2 = a 2 , calcular el valor de la integral de 
superficie 


J J xz dy a dz 4- yz dz a dx + x 2 dx A dy. 
s 

Elegir una representacion para la que el producto vectorial fundamental tenga la direc- 
cion de la normal exterior. 

8 . El cilindro x 2 + y 2 = 2x recorta una porcion de superficie S en la hoja superior del 
cono x 2 -f y 2 = z 2 . Calcular la integral de superficie 

[j (x 4 - / 4- /V - z 2 x 2 4- 1) dS. 

's 

9. Un recipiente esferico homogeneo de radio a esta cortado por una hoja de un cono 
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circular recto cuyo vertice esta en el centra de la esfera. Si el angulo en el vertice del 
cono es a, siendo 0 < a < ir, determinar (en funcion a a y a) el centra de gravedad 
de la porcion del recipienle esferico que es interior al cono. 

10. Una hoja de papel rectangular homogenea de base 2-rra y altura h se arrolla formando 
una superficie cih'ndrica S de radio a. Calcular el momento de inercia de S alrededor de 
un eje que contiene un diametro de la base circular. 

11. En relacion con el ejercicio 10, calcular el momento de inercia de S alrededor de un 
eje situado en el piano de la base y que es tangente al borde circular de la base. 

12. Un flujo de fluido tiene como vector densidad de flujo F(x, y , z) = xi — (2x + y)j +zk. 
Designemos con S el hemisferio x 2 + y 2 -f z 2 = 1, z > 0, y con n la normal unitaria 
orientada hacia el exterior de la esfera. Calcular la masa de fluido que atraviesa S en la 
unidad de tiempo en la direccion de n. 

13. Resolver el ejercicio 12 si S contiene tambien la base plana del hemisferio. En la base 
inferior la normal unitaria es —k. 

14. Sea S la porcion del piano x+y+z—t determinada en el por la esfera x 2 -fy 2 -fz 2 = 1. 
Sea <p(x, y, z) = 1 — x 2 — y 2 — z 2 si (x, y, z) es interior a dicha esfera, y <p(x, y, z) = 0 
en cualquier otro caso. Demostrar que 


JJ 


<p(x, y, z) dS 


^(3-/ 2 ) 2 si |/i<V3. 
0 si |/| > sj3. 


[Indication. Tomar unos ejes coordenados (*i,yi,zi) con el eje zi normal al piano 
x + y + z = t. Usar luego coordenadas polares en el piano xiyx como parametros para S.] 

12.11 Teorema de Stokes 

El resto de este capftulo esta especialmente dedicado a dos generalizaciones 
del segundo teorema fundamental del Calculo a las integrales de superficie. Se 
conocen, respectivamente, con las denominaciones de Teorema de Stokes (*) y 
Teorema de la divergencia. Esta seccion trata del primero, y en la seccion 12.19 se 
expondra el segundo. 

El teorema de Stokes es una extension directa del teorema de Green el cual 
establece que 


Si(^- d ^j dxi,, -L pdx + Qdy ' 

s 

en donde S es una region plana limitada por una curva cerrada C recorrida en 
sentido positivo (contrario al de las agujas del reloj). El teorema de Stokes rela- 
ciona una integral de superficie con una integral de linea y puede enunciarse asf: 

(*) En honor de G. G. Stokes (1819-1903), matematico irlandes que consiguio contribu- 
ciones fundamentales en la Hidrodinamica y en la Optica. 
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teorema 12.3. teorema de stokes. Supongamos que S es una superficie 
parametrica simple regular, S —r(T), siendo T una region del piano uv limitada 
por una curva de Jordan regular a trozos F. (Ver figura 12.12.) Supongamos tam- 
bien que r es una aplicacion uno a uno cuyos componentes tienen derivadas par- 
ciales segundas continuas en un cierto conjunto abierto que contenga T U T. De- 
si gnemos con C la imagen de T por r, y sean P, Q y R campos escalares derivables 
con continuidad en S. Tenemos entonces 



Figura 12.12 Ejemplo de superficie a la que es aplicable el teorema de Stokes. 


La curva r se recorre en sentido positivo (contrario al de las agujas del reloj) 
y la curva C en el sentido que resulte de aplicar a Y la funcion r. 

Demostracion. Para demostrar el teorema basta establecer las tres formulas 
siguientes, 


J P dx = JJ — dx A dy + ^ dz A dx 


( 12 . 28 ) 
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i? dy = [j { 

La suma de esas tres ecuaciones nos da la formula (12.27) del teorema de Stokes. 
Puesto que las tres son parecidas, tan solo demostramos la (12.28). 

El plan de la demostracion consiste en expresar la integral de superficie como 
una integral doble sobre T. Entonces se aplica el teorema de Green para expresar 
la integral doble sobre T como una integral de linea sobre E. Por ultimo, demos¬ 
tramos que esta integral de linea es igual a fc P dx. 

Escribamos 


— ^ dy A dz + ~ dx A dy^j , 

dR , , , dR , ,\ 

- dz A dx -\ - dy A dz . 

dx dy } 


r(u, v) = X(u, v)i + Y(u, v)j + Z(u, v)k 


y expresemos la integral de superficie sobre S en la forma 


-% dxydy + \ ^ A "*)-JJ( 


_sxmj) + sp 

dy d(u, v) dz d(u, v ) J 


Designemos ahora con p la funcion compuesta dada por 

p(u, v) = P[X(u, v ), Y(u, v), Z(u, d)] . 

El ultimo integrando puede escribirse en la forma 


(12.29) 


dP d(X, Y) ^ dP d(Z, X) _ d / 3X\ _ d_f dX\ 
dy d(u,v) dz d(u,v ) du\ dvj dv\ du) 


En el ejercicio 13 de la seccion 12.13 se dan las directrices de la comprobacion 
de (12.29). Aplicando a la integral doble sobre T el teorema de Green obtenemos 


-i( pd £)} di,d ’ = L pd £‘ iu 


, dX 
+ p — dv, 
dv 


en donde r se recorre en sentido positivo. Parametricemos P mediante una funcion 
y definida en un intervalo [a,b] y sea 


( 12 . 30 ) 


«(0 = r[y(0] 
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la correspondiente parametrizacion de C. Expresando entonces cada integral de 
linea en funcion de su representacion parametrica encontramos que 

[ p— du + p — dv= f Pdx, 

Jr du dv Jc 

lo cual completa la demostracion de (12.28). 

12.12 El rotacional y la divergencia de un campo vectorial 

La integral de superficie que aparece en el teorema de Stokes puede expre- 
sarse en forma mas sencilla en funcion del rotacional de un campo vectorial. 
Sea F un campo vectorial derivable dado por 


F{x, y, z) = P(x, y, z)i + Q(x, y, z)j + R(x, y, z)k. 

El rotacional de F es otro campo vectorial definido mediante la ecuacion 


(12.31) 


rot F = 


/dR 

W 





k. 


Los componentes de rot F son las funciones que aparecen en la integral de su¬ 
perficie de la formula de Stokes (12.27). Por consiguiente, esta integral de super¬ 
ficie puede ponerse en la forma 

j j (rot F)- ndS, 
s 

siendo n el vector unitario normal que tiene el mismo sentido que el producto 
vectorial fundamental de la superficie; esto es, 

dr_ dr 
du dv 

n ---. 

dr dr 

du dv 


La integral de linea en la formula de Stokes (12.27) puede ponerse en la 
forma j' c F ■ da, siendo a la representacion de C dada por (12.30). Asi pues, el 
teorema de Stokes toma la forma mas sencilla 

( rot F) ■ n dS = f F ■ da. 
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Para el caso especial en el que 5 es una region del piano xy y n — k, esta 
formula se reduce a 


Sc p, ' x+e ‘ h '- 

La ecuacion (12.31) que define el rotacional puede recordarse facilmente 
escribiendola como un desarrollo de un determinante de tercer orden, 

k 

r “(r-FMr-rMF-r)*- 

oz \dy oz ] \Bz Bx/ \dx By/ 

R 


rot F = 


i J 

JL A. 

Bx By 
P Q 


Este determinante esta desarrollado por la primera ftla, pero cada «producto» 
como el de 3/3y por R debe interpretarse como la derivada parcial dR/dy. Tam- 
bien podemos escribir esa formula como un producto vectorial 

rotF = V x F, 


en donde el sfmbolo V se maneja como si fuera un vector, 


v -h l+ i i+ i k - 


Si formamos el «producto escalar» V • F de modo puramente formal, in- 
terpretando otra vez los productos tales como B/3x por P como BP/Bx, encontra- 
mos que 


(12.32) 


v ' f =f + ? + 

Bx By 


3_R 

Bz 


La ecuacion (12.32) define un campo escalar llamado divergencia de F, y se escri¬ 
be div F. 

Ya hemos utilizado el sfmbolo Vq para designar el gradiente de un campo 
escalar q, dado por 
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Esta formula puede interpretarse como una multiplicacion formal del vector sim- 
bolico V por el campo escalar <j . Asi pues, el gradiente, la divergencia y el rota- 
cional pueden representarse simbolicamente por los tres productos V<y, V F, y 
V X F, respectivamente. 

Algunos de los teoremas antes demostrados pueden expresarse en funcion del 
rotacional. Por ejemplo, en el teorema 10.9 se demostro que un campo vectorial 
f = (/,,..., /„), derivable con continuidad en un conjunto convexo abierto S del 
tt-espacio, es un gradiente en S si y solo si las derivadas parciales de los compo- 
nentes de / satisfacen las relaciones 

(12.33) D k f } (x) = DJ k (x) (j,k — 1,2, ... ,n). 

En el caso tri-dimensional, el teorema 10.9 puede enunciarse asi. 

TEOREMA 12.4. Si F=Pi + Qj + Rk es un campo vectorial derivable con 
continuidad en un conjunto convexo abierto S del espacio de 3 dimensiones, en- 
tonces F es un gradiente en S si y solo si tenemos 

(12.34) rot F = O en S. 

Demostracion. En el caso tri-dimensional las relaciones (12.33) son equi- 
valentes a la afirmacion de que rot F = O. 

12.13 Ejercicios 

En cada ejercicio del 1 al 4, transformar la integral de superficiefj (rot F) ■ n d.S en 

.S' 

una integral de linea utilizando el teorema de Stokes, y calcular entonces la integral de linea. 

1. F{x,y, z) = y 2 i + xyj + xzAr.donde S es el hemisferio x 2 + y 2 -f z 2 = 1, z > 0, y n 
es la normal unitaria con componente z no negativa. 

2. Fix, y, z) = yi + zj + xk , donde S es la parte de paraboloide z — \ — x 2 — y 2 con 
z > 0, y n es la normal unitaria con componente z no negativa. 

3. F(x,y,zj = (y — z)i + yzj — xzk ,donde S consta de las cinco caras del cubo 0<x<2, 
0<j<2,0<z<2no situadas en el piano xy. n es la normal unitaria exterior. 

4. F{x,y,z) = xzi — yi + x 2 yk , donde S consta de las tres caras no situadas en el 

piano xz del tetraedro limitado por los tres pianos coordenados y el piano 3x+y + 3z = 6. 

La normal n es la normal unitaria exterior del tetraedro. 

En los ejercicios del 5 al 10, usar el teorema de Stokes para demostrar que las integra- 
les de linea tienen los valores que se dan. En cada caso, explicar el sentido en el que se 
recorre C para llegar al resultado. 

5. J c y dx + 2 dy + x dz — rrd 1 v 3 , siendo C la curva de interseccion de la esfera 

x 2 + y 2 + z 2 = a 2 y el piano x + y -f z = 0. 
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6. fc 0 4" z ) dx 4- (z + x) dy + (x + y) dz =0, siendo C la curva de intersection del 
cilindro x 2 + y 2 = 2y y el piano y = z. 

7. J c y 2 dx + xy dy + xz dz =0, donde C es la curva del ejercicio 6. 

8. f c . (y — z) dx + (z — .v) dy + (x — y) dz = Ina(a + b), donde C es la interseccion 

del cilindro x 2 + y 2 = a 2 y el piano x/a + z/b = 1, a > 0, b > 0. 

9- Sc O’ 2 + z2 ) dx + ( x 2 + z 2 ) dy + ( x 2 + y 2 ) dz = 2 -nab 2 , siendo C la interseccion del 
hemisferio x 2 + y 2 + z 2 = 2ax, z > 0, y el cilindro x 2 + y 2 — 2 bx, donde 0 < b < a. 

10. fc (y 2 ~ z 2 ) dx + (z 2 — x 2 ) dy + (x 2 — y 2 ) dz = 9a 3 /2, donde C es la curva interseccion 
de la superficie del cubo0< x <a,0< y <a, 0< z < a y el piano x + y + z = 3a/2. 

11. Si r = xi + yj + zk y Pi + Qj + Rk = a x r , siendo a un vector constante, demos- 
trar que| ( , P dx + Q dy + R dz = 2 JJ a ■ n dS, donde C es una curva que limita una 

& 

superficie parametrica S y n es la normal a S adecuada. 

12. Sea F = Pi + Qj + Rk, donde P = — y/(x 2 +_y 2 ), Q = x/(x 2 + y 2 ), R — z. Sea D 

el toro engendrado por la rotacion de la circunferencia (x - 2) 2 + z 2 = 1, y = 0, alre- 

dedor del eje z. Demostrar que rot F = Opero que J ( . P dx + Qdy + Rdz no es cero 
si la curva C es la circunferencia x 2 + y 2 = 4, z = 0 . 

13. Este ejercicio da indicaciones para una demostracion de la ecuacion (12.29) usada al 
demostrar el teorema de Stokes. 

a) Utilizar la formula de la derivacion de un producto para probar que 

_3 / Mf\ d / dX\ _ dp dX dp dX 
day dv / dvy du ) du dv dv du 

b) Pongase p(u,v) =P[X(u,v), Y(u, v), Z(u, v)]. Calcular dp/du y dpjdv por medio 
de la regia de la cadena y aplicar la parte a) para deducir la ecuacion (12.29), 

— ( _JL( Y) dPd(Z,X) 

du\ p dv ) dv\ p du) ~ dy d{u,v) + Tz d(u, v) ' 


12.14 Otras propiedades del rotacional y de la divergencia 

El rotacional y la divergencia de un campo vectorial estan relacionados con 
la matriz jacobiana. Si F = Pi + Qj + Rk, la matriz jacobiana de F es 

dP dP~ 
dy dz 

dQ dQ 
dy dz 

dR dR 

dy dz _ 

La traza de esta matriz (la suma de elementos de su diagonal principal) es la diver¬ 
gencia de F. 
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Toda matriz real A puede escribirse como suma de una matriz simetrica, 
l(A + A 1 ) y de una matriz hemi-simetrica, J (A — A*). Cuando A es la matriz 
jacobiana DF, la parte hemi-simetrica se convierte en 



n 


dP 


dP 

dR 


u 


dy 

dx 

dz 

dx 

1 

d -2 _ 

dp 


0 

d_Q 

dR 

2 

dx 

dy 


dz 

dy 


dR 

dP 

dR 



o 


_dx 

dz 

dy 

dz 




Los elementos no nulos de esta matriz son los componentes de rot F y sus opuestos. 
Si la matriz jacobiana DF es simetrica, cada elemento de (12.35) es cero y 
rot F — O. 

ejemplo 1. Sea F(x, y, z ) = xi + yj + zk . Tenemos entonces 


P(x,y, z) = x, Q(x,y,z)=y, R(x,y,z) = z, 

y la matriz jacobiana correspondiente es la matriz identica de orden 3X3. Por 
lo tanto 

div F = 3 y rot F = O. 

En general, siF(x,j, z) =f(x)i + g(y)j + h(z)k, la matriz jacobiana tiene los ele¬ 
mentos f(x), g'(y), h'(z) en la diagonal principal y ceros los restantes elementos, 
asf que 


div F =/' (x) + g’(y) + h\z) y rot F = O 

ejemplo 2. Sea F(x,y, z) = xy 2 z 2 i + z 2 sen yj + x 2 e y k. La matriz jacobia¬ 
na es 

-y 2 z 2 2xyz 2 2 xy 2 z ~ 

0 z 2 cosy 2zsenj . 

2xe v x 2 e v 0 

Por lo tanto, 

div F = y 2 z 2 + z 2 cos y 

y 

rot F = (x 2 e v — 2zsen_y)f + (2xy 2 z — 2xe y )j — 2 xyz 2 k. 
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ejemplo 3. Divergencia y rotacional de un gradiente. Supongamos que 
F es un gradiente, sea 
cobiana es 


(12.36) 


Por consiguiente, 


grad 9 ? 

= d<p/d 

xi + d(p 

d 2 tp 

d 2 <p 

d 2 (p 

dx 2 

dy dx 

dz dx 

d 2 (p 

d 2 cp 

d 2 (p 

dx By 

d? 

dz dy 

d 2 (p 

d 2 cp 

d 2 cp 

_dx dz 

dy dz 

d? _ 

div F = 

d 2 w 

d? + 

dy 2 dz 


La expresion del segundo miembro se llama laplaciana de qp y a menudo se re- 
presenta con el sfmbolo V 2 <p. Asi pues, la divergencia de un gradiente V<p es la 
laplaciana de <p. Simbolicamente esto se expresa poniendo 

(12.37) div (V<p) = V 2 <p. 

Cuando V 2 cp— 0, la funcion 9 ? se llama armonica. La ecuacion (12.37) hace ver 
que el gradiente de una funcion armonica tiene divergencia nula. Cuando las 
derivadas parciales mixtas que aparecen en la matriz (12.36) son continuas, la 
matriz es simetrica y rot F es cero. Es decir, 

rot (grad (f)-O 

para todo campo escalar <p con derivadas parciales segundas mixtas continuas. 
Este ejemplo demuestra que rot F — O es condicion necesaria para que un campo 
vectorial F derivable con continuidad sea un gradiente. Dicho de otro modo, si 
rot F O en un conjunto abierto S, entonces F no es un gradiente en S. Sabe- 
mos tambien, segun el teorema 12.4 que si rot F — O en un conjunto convexo 
abierto S, entonces F es un gradiente en S. Un campo con rotacional nulo se llama 
irrotacional. 


ejemplo 4. Campo vectorial con divergencia y rotacional nulos. Sea S el 
conjunto de todos los puntos ( x, y) ^ ( 0 , 0 ), y pongamos 


F(x, y) 


y 

x 2 + / 


i + 


x . 

x 2 + y* j 
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si (x, y) 6 S. Segun el ejemplo 2 de la seccion 10.16 sabemos que F no es un 
gradiente de S (si bien F es un gradiente en todo rectangulo que no contenga 
el origen). La matriz jacobiana es 


DF(x, y ) 


2 xy /-x 2 

(x 2 + /) 2 (x 2 + y 2 ) 2 
/-x 2 —2xy 

(x 2 + /) 2 (x 2 + /) 2 
0 0 0 _ 


y vemos al momento que div F = 0 y rot F = O en S. 

ejemplo 5. Divergencia y rotacional de un rotacional. Si F = Pi + Qj + Rk, 
el rotacional de F es un nuevo campo vectorial y podemos calcular su divergencia 
y su rotacional. La matriz jacobiana de rot F es 


' d 2 R 

d 2 Q 

d 2 R 

d 2 Q 

d 2 R 

_ d^Q 

dx dy 

dx dz 

dy 2 

dy dz 

dz dy 

dz 2 

d 2 P 

d 2 R 

d 2 p 

d 2 R 

d 2 P 

d 2 R 

dx dz 

1 w 

X 

1 

1 

dy dz 

dy dx 

dz 2 

dz dx 


d z P 

d 2 Q 

d 2 P 

d 2 Q 

d 2 p 

_ dx 2 

dx dy 

dy dx 

dy 2 

dz dx 

dz dy_ 


Si suponemos que todas las derivadas parciales mixtas son continuas, encontra- 
mos que 

div ( rot F) = 0 

y 

(12,38) rot ( rot F) = g ra d (^v F ) — V 2 F, 


estando definida V 2 Fmediante la ecuacion 

V*F = (V 2 F)i + (V 2 0y + (V*R)k. 

La identidad (12.38) relaciona los cuatro operadores, gradiente, rotacional, diver¬ 
gencia y laplaciana. En el ejercicio 7 de la seccion 12.15 se propone la comproba- 
cion de (12.38). 

El rotacional y la divergencia tienen algunas propiedades generales analogas 
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a las de las derivadas ordinarias. En primer lugar, son operadores lineales. Esto 
es, si a y b son constantes, tenemos 


(12.39) div (aF + bG) = a div F + b div G, 

y 

(12.40) rot (aF + bG) = a rot F + b rot G. 

Tambien poseen la propiedad analoga a la formula de la derivacion de un pro- 
ducto: 

(12.41) div ( <pF ) = <p div F + V 99 • F, 

y 

(12.42) rot (cpF) = cp rot/'+ V 99 x F, 

donde cp es cualquier campo escalar derivable. Estas propiedades son consecuencias 
inmediatas de las definiciones de rotacional y divergencia; sus demostraciones se 
proponen en el ejercicio 6 de la seccion 12.15. 

Si empleamos el vector simbolico 


v -i i+ r y i+ l k 


una vez mas, cada una de las formulas (12.41) y (12.42) toma una forma muy 
parecida a la regia de la derivacion de un producto: 


y 


V • (<pF) = 99 V • F + V 99 ■ F 
V x ( <pF) == 99 V x F + V 99 x F. 


En el ejemplo 3 la laplaciana de un campo escalar, V 2 y , se definio como 
d 2 <p/dx 2 + d 2 <pldy 2 +d 2 cpjdz 2 .En el ejemplo 5 la laplaciana V 2 F de un campo vec¬ 
torial se definio por medio de los componentes. Obtenemos formulas correctas 
para V 2 9 ?y para V 2 F si interpretamos V 2 como el operador simbolico 

dx 2 dy z dz 2 
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Esta formula para V 1 2 3 4 5 6 7 8 tambien resulta por multiplication interior del vector simbo- 
lico V por si mismo. 

Asi, tenemos V 2 = V • V y podemos escribir: 

V 2 y = (V • V)y< y V 2 F = (V • V)F. 

Consideremos ahora la formula V • Vy.. fista puede interpretarse como (V • V)y, 
que es V 2 y; o como V ■ (Vy), que es div (Vy). En el ejemplo 3 se demostro que 
div (Vy) = V 2 y , asi tenemos, 


(V • V)y = V- (Vy); 


luego podemos escribir V • Vy; para una u otra de esas expresiones sin peligro de 
ambigiiedad. Esto no es cierto, sin embargo, cuando y se sustituye por un campo 
vectorial F. La expresion (V • V)F es V 2 F, que ha sido defmida. No obstante, 
V • (VF) no tiene significado a causa de que VF no esta defmido. Por lo tanto, 
la expresion V • VF tiene significado unicamente cuando se interpreta como 
(V • V)F. Estas observaciones hacen ver que si bien las formulas simbolicas 
sirven algunas veces como notacion manejable y mnemotecnica, es preciso utili- 
zarlas con mucha precaution. 

12.15 Ejercicios 


1. Para cada uno de los siguientes campos vectoriales determinar la matriz jacobiana y 
calcular el rotacional y la divergencia 

a) F(x, y, z) = (x 2 4- yz)i 4- (y 2 + xz)j + (z 2 4- xy)k. 

b) F(x, y, z) = (2 z - 3 y)i 4- (3x - z)j + (y - 2 x)k. 

c) F(x,y, z) — (z +sen y)i — (z — x cos y)j. 

d) F{x, y, z) = e xv i 4- cos xy j 4- cos xz 2 k. 

e) F{x, y, z ) = x 2 sen y i 4 - y 2 sen xz j 4- xy sen (cos z)k. 

2. Sir = xi 4- yj 4- zk y r = j|r|| .calcular rot [f(r)r], siendo / una funcion derivable. 

3. Sir = xi + yj 4- zk y A es un vector constante, demostrar que rot (A x r) —2A . 

4. Sir = xi 4- yj 4- zky r = ||r|[ , hallar todos los valores de n para los que(r”r) = 0. 

5. Hallar un campo vectorial cuyo rotacional es xi 4- yj 4- zk o demostrar que no existe 
un tal campo vectorial. 

6 . Demostrar las propiedades elementales del rotacional y de la divergencia expresada en 
las ecuaciones de la (12.39) a la (12.42). 

7. Demostrar que rot(rot F) = grad(div F) - V 2 Fsi los componentes de F tienen derivadas 
parciales mixtas de segundo orden continuas. 

8 . Demostrar la identidad 

V ■ (F x G) = G ■ (V x F) - F • (V x G), 
donde F y G son campos vectoriales diferenciables. 
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9. Un campo vectorial F no sera gradiente de un potencial a menos que rot F = O. 
No obstante, es posible encontrar un campo escalar no nulo n tal que /iF es un gra- 
diente. Demostrar que si un tal n existe, F es siempre perpendicular a su rotacional. 
Cuando el campo es bidimensional.F = Pi + Qj ,e ste ejercicio nos da una condicion 
necesaria para que la ecuacion diferencial P dx + Q dy = 0 posea un factor integrante. 
(El reci'proco tambien es cierto. Esto es, si F*rotF=0 en una region conveniente, 
existe un /t no nulo tal que ,nF es un gradiente. La demostracion del reci'proco no 
se pide.) 

10. Sea F(x, v, z) = y-z’i + zrx'-j + x- y-k . Demostrar que rot F no es siempre cero, pero 
que f. rot F= 0. Hallar un campo escalar n tal que /iF sea un gradiente. 

11. Sea F(.v, r) = f'7 + .v'y, donde c es una constante positiva, y sea r(x, )■) = xi + vj. 
Consideremos una region plana R bordeada por una curva de Jordan regular a trozos C. 
Calcular div (V x /•) y rot (F x r) y aplicando el teorema de Green demostrar que 


(j> c V x r ■ da. = 0 , 

donde a es la funcion que describe C. 

12. Demostrar que el teorema de Green puede expresarse en la forma 


(rot V)- kdxdy = j V-Tds, 

c 

donde T es el vector unitario tangente a C y j es la longitud de arco. 

13. Una region plana R esta limitada por una curva de Jordan regular a trozos C. Se cono- 
cen los momentos de inercia de R alrededor de los ejes x e y que valen respectivamente 
a y b. Calcular la integral de lfnea 



R 


V(r 4 ) nds 


en funcion de a y b. En esta integral, r = | \xi + yj\\ , n representa el vector unitario 
normal exterior a C y s es la longitud de arco. La curva se recorre en sentido contrario 
al de las agujas del reloj. 

14. Sea F un campo vectorial bidimensional. Dar una defmicion de la integral de linea 
Sc F x da. Esa defmicion debe ser tal que pueda obtenerse como consecuencia del 
teorema de Green la formula siguiente: 

f F x da = k | J (div F) dx dy , 
c R 

siendo R una region plana limitada por una curva cerrada simple C. 

* 12.16 Reconstruction de un campo vectorial a partir de su rotacional 

Al estudiar el gradiente hemos aprendido a determinar si un campo vectorial 
dado es o no un gradiente. Consideramos ahora la cuestion analoga relativa al rota- 
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cional. Dado un campo vectorial F, r,hay un G tal que rot G = F? Supongamos 
que F — Pi + Qj + Rk y G =Li + Mj + Nk . Para resolver la ecuacion rot G — F 
tenemos que resolver el sistema de ecuaciones diferenciales en derivadas parciales 


(12.43) 


3N _ dM_ _ p 3L _ d/V = ^ dJA _ dL 
dy dz dz dx ’ dx dy 


en las que P, Q y R son conocidas y L, M, N son las funciones incognitas. 

No siempre es posible resolver tal sistema. Por ejemplo, se demostro en la 
section 12.14 que la divergencia de un rotacional es siempre cero. Por tanto, para 
que el sistema (12.43) tenga solucion en un cierto conjunto abierto S es nece- 
sario que 


(12.44) 


5£ + «2 + ?« = o 

dx dy dz 


en todo S. Esta condicion es tambien suficiente si restringimos convenientemente 
el conjunto S en el que se verifica (12.44). A continuation demostramos que la 
condicion (12.44) es suficiente cuando S es un intervalo tridimensional. 


teorema 12.5. Si F es derivable con continuidad en un intervalo abierto 
S de Ei, entonces existe un campo vectorial G tal que rot G — F si y solo si 
div F = 0 en todo S. 


Demostracidn. La necesidad de la condicion div F = 0 ha sido ya estableci- 
da, puesto que la divergencia de un rotacional siempre es cero. Para establecer 
la suficiencia tenemos que encontrar tres funciones L, M, y N que satisfagan las 
tres ecuaciones (12.43). Intentemos resolver el problema tomando L — 0. Enton¬ 
ces la segunda y tercera ecuaciones (12.43) se transforman en 


dN 

dx 


= -Q 


y 



Esto indica que debe ser: 

N(x, y, z) = - I"* Q(t, y, z) dt + f(y, z) 

" Xq 

y r. 

M(x, y,z)= R(t, y, z) dt + g(y, z), 

‘'ZO 

donde cada integration se efectua a lo largo de un segmento rectilineo contenido 
en S y las «constantes de integracion» f(y, z ) y g(y, z) son independientes de x. 
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Para hallar una solution hagamos /( y, z) = 0. La primera ecuacion (12.43) exige 


(12.45) 


dN _ dM 
dy dz 


Segun la election de M y N que se ha indicado tenemos: 


(12.46) 


dN 

dy 


dM d T 

dz dy Jx 0 


Q(t, y, z ) dt 


d_ r 

dz Jx 0 


R(t, y, z) dt — ~ . 
i dz 


Seguidamente permutamos las dos operaciones de derivation parcial e inte¬ 
gration aplicando el teorema 10.8. Esto es, escribimos: 


(12.47) 


d_ 

dy 



, y, z) dt 



D t Q(t, y, z) dt 


y 

(12.48) 


~ f R(t,y,z)dt= f D 3 R(t, y, z) dt. 

OZ Jx 0 Jxo 


Con ello la ecuacion (12.46) se convierte en 


(12.49) 


dN dM 
dy dz 


£ 


[~ D 2 Q(t, y, z) - D 3 R(t, y. 


z)] dt - ^ 

dz 


En virtud de la condicion (12.44) podemos reemplazar el integrando de (12.49) 
por D t P{t, y, z); la ecuacion (12.49) toma la forma 


dN dM 
dy dz 



P(x, y, z) - P(x 0 , y, z) - 


H 

dz 


Por consiguiente, (12.45) se satisfara si elegimos g de modo que dg/dz = 
= —P(x„,y,z). Asi, por ejemplo, podemos tomar 


g(y, z) = - J Z P(x 0 , y, u) du. 

JZq 

Este razonamiento nos lleva a considerar el campo vectorial G = Li + Mj + Nk, 
donde L(x, y, z) = 0 y 

M(x, y, z ) = R(t, y, z) dt - P(x 0 , y, u) du , N(x, y, z) = — J* Q(t, y, z) dt. 
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Con estas tres funciones L, M y N es facil comprobar, por medio de (12.47) y 
(12.48), que se satisfacen las tres ecuaciones (12.43), obteniendo rot G — F , como 
deseabamos. 

Debe observarse que la demostracion precedente no solo establece la exis¬ 
tence de un campo vectorial G cuyo rotacional es F, sino que tambien propor- 
ciona un metodo directo para determinar G por medio de integrates calculadas 
con los componentes de F. 

Para una F dada, el campo vectorial G que hemos construido no es la unica 
solucion de la ecuacion rot G — F. Si sumamos a G cualquier gradiente derivable 
con continuidad V (f obtenemos otra solucion ya que 

rot (6 +V?)= rot G + rot (V?) = rot G = F, 

puesto que rot (V <() = O . Ademas, es facil demostrar que todas las soluciones 
derivables con continuidad deben ser de la forma G + V q .. En realidad, si H 
es otra solucion, entonces rot H = rot G ,de manera que rot (H — G) — O Se- 
gun el teorema 10.9 resulta que H - G = V q para algun gradient? derivable 
con continuidad V </; luego H = G + V q ., como se afirmo. 

Un campo vectorial F para el que div F = 0 suele llamarse solenoidal. El 
teorema 12.5 establece que un campo vectorial es solenoidal en un paralelepipedo 
rectangular abierto S si, y solo si, es el rotacional de otro campo vectorial en S 

El ejemplo que sigue demuestra que esta afirmacion no es valida para con- 
juntos abiertos cualesquiera. 

ejemplo. Un campo vectorial solenoidal que no es un rotacional. Sea D la 
parte de E 3 comprendida entre dos esferas concentricas de centra en el origen 
y radios a y b, siendo 0 < a < b. Sea V = r/r 3 , donde r — xi + yj + zk 
y r — j|r||. Es facil comprobar que div V = 0 en todo D. En efecto, tenemos la 
formula general 


div ( r”r ) = (n + 3)r”, 

y en este ejemplo n = — 3. Usaremos el teorema de Stokes para demostrar que 
V no es un rotacional en D (si bien lo es en todo intervalo tridimensional abierto 
que no contenga el origen). Para ello supongamos que existe un campo vectorial 
U tal que V = rot U en D y llegamos a una contradiccion. Segun el teorema 
de Stokes podemos escribir 

| | (rot U) ■ n dS = j c ,U-da, 

s 


(12.50) 
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Figura 12.13 La superficie S y la curva C de la ecuaciun (12.50). 


donde S y C son la superfice y la curva dibujada en la figura 12.13. Para cons- 
truir S, tomamos una superficie esferica de radio R concentrica con las fronteras 
de D, siendo a < R < b, y quitamos un pequeno casquete polar como se indica 
en la figura. La parte que queda es la superficie S. La curva C es el borde circular 
dibujado. Representemos con n la normal unitaria exterior a S, de modo que 
n = rjr. Puesto que rot U = V = r/r 3 , tenemos 


(rot V)-n 



Sobre la superficie S este producto vectorial tiene el valor constante 1/R 2 . Por lo 
tanto, tenemos, 


s s 


Cuando el casquete polar degenera en un punto el area de S tiende a 4-n-R 2 (area 
de toda la esfera) y por consiguiente, el valor de la integral de superficie (12.50) 
tiende a 4tt. 

Examinemos seguidamente la integral de linea de (12.50). Es facil demostrar 
que para toda integral de linea J c V ■ da tenemos la desigualdad 



donde M es una constante que depende de U. (En efecto, M puede tomarse como 
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el maximo de ||t/||en C).Por consiguiente, al reducir el casquete polar a un punto, 
la longitud de C y el valor de la integral de lfnea tienden ambos a cero. Llegamos 
asi a una contradiccion; la integral de superficie (12.50) tiende a 4?r, y la corres- 
pondiente integral de linea a la que es igual tiende a 0. Luego no puede existir 
en la region D una funcion U cuyo rotacional sea V . 

La dificultad aqui es debida a la estructura geometrica de la region D. Si bien 
esta region es simplemente conexa (esto es, toda curva cerrada simple en D es el 
borde de una superficie parametrica contenida totalmente en D) existen superfi¬ 
cies cerradas en D que no son frontera completa de un solido contenido entera- 
mente en D. Por ejemplo, ninguna esfera que incluya el origen es la frontera 
completa de un solido enteramente contenido en D. Si la region D tiene la pro- 
piedad de que toda superficie cerrada contenida en D es la frontera de un solido 
enteramente contenido en D, puede demostrarse que existe un campo vectorial 
U tal que V = rot U en D si, y solo si, div V = 0 en toda region D. La de- 
mostracion es dificil y no la daremos aqui. 

* 12.17 Ejercicios 


1. Hallar un campo vectorial G (x, y, z) cuyo rotacional es 2/ + j + 3ken todo E 3 . cCual 
es el campo vectorial derivable con continuidad del tipo mas general con esa propiedad? 

2. Demostrar que el campo vectorial F(x,y, z) — (y — z)i 4- (z — x)j 4- (x — y)k es so- 
lenoidal, y hallar un campo vectorial G tal que F = rot G 

3 . Sea F(x,y,z) = —zi + xyk. Hallar un campo vectorial derivable con continuidad G 
de la forma G{x,y,z)=L(x,y,z)i+M(x,y,z)j tal que F =rot G en todo paralelepipedo 
rectangular de £3- cCual es el G mas general de esa forma? 

4. Si dos campos vectoriales V y V son irrotacionales, demostrar que el campo vectorial 
U x Fes solenoidal. 

5. Sea r — xi + yj + zk y r = j|r[|. Demostrar que n = — 3 es el unico valor de n para el 
que r n r es solenoidal siendo r ^ 0. Para este n, elegir un paralelepipedo S que no con- 
tenga el origen y expresar r~ 3 r como un rot en S. [Advertencia. Si bien r~ 3 r es un rota¬ 
cional en cualquier S de este tipo, no to es en el conjunto de todos los puntos distintos 
del (0,0,0)]. 

6 . Encontrar la forma mas general de una funcion j derivable con continuidad y de una 
sola variable real tal que el campo vectorial f(r)r sea solenoidal, donde r = xi + yj + 
+ zky r ='||r||. 

7. Sea V un campo vectorial derivable con continuidad en cierto paralelepipedo rectan¬ 
gular S de £3. Consideremos las dos afirmaciones siguientes relativas a V: 

( I ) rot V = O y V = rot U para algun campo vectorial U derivable con continuidad 
(en todo S). 

( II ) Existe un campo escalar <p tal que V <p es derivable con continuidad y 

V = grad q> y X 2 q> =0 en todo S. 

a) Demostrar que ( 1 ) implica ( 11 ). Dicho de otro modo, un campo vectorial que es a la 
vez irrotacional y solenoidal en S es el gradiente de una funcion armonica en S. 

b) Demostrar que ( 11 ) implica ( 1 ), o dar un contraejemplo. 



552 


Integrates de superficie 


8. Supongamos todos los campos vectoriales que se consideren derivables con continuidad. 
Sea H = F + G , donde F es solenoidal y G irrotacional. Existe entonces un campo 
vectorial U tal que F = rot U y un campo escalar <p tal que G = V <p en S. Demostrar 
que U y <p satisfacen en S la siguiente ecuacion diferencial en derivadas parciales: 

V 2 ?) = div H, grad (div V) - V 2 U = rot H. 

Observation. Este ejercicio es de gran utilidad, a causa de que puede demostrar- 
se que todo campo vectorial H derivable con continuidad en S puede expresarse en la 
forma// — F + G donde F es solenoidal y G irrotacional. 

9. Sea H(x,y,z) = x 2 yi + y 2 zj + z 2 xk. Hallar los campos vectoriales F y G, donde F 

es un rotacional y 6 un gradiente, de modo que se verifique H — F + G. 

10. Sean u y v dos campos escalates derivables con continuidad en un intervalo abierto 

de E 3 . 

a) Demostrar que existe un campo vectorial F tal que Vu X Vv = rot Fen todo R. 

b) Determinar si cualquiera de los tres campos vectoriales siguientes pueden o no ser 

utilizados como F en la parte a): i) V(uv); ii) uVr; in) vVu. 

c) Si u(x, y, z) = x 3 — y 3 + z 3 y v(x, y, z) = x + y + z, calcular la integral de superficie 

JJ Vu X Vv ■ ndS, 

s 

en donde S es la semiesfera x 2 + y 2 + z 2 = 1, z > 0, y n es la normal unitaria con 
un componente z no negativo. 

12.18 Extensiones del teorema de Stokes 


El teorema de Stokes puede extenderse a superficies regulares simples mas 
generales. Si T es una region multiplemente conexa parecida a la de la figura 



Figlha 12.14 Extension del teorema de Stokes a superficies que son imagenes uno a uno 

de regiones multiplemente conexas. 
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12.14 (con un numero finito de agujeros), la imagen uno a uno S = r(T) conten¬ 
ds el mismo numero de agujeros que T. Para extender el teorema de Stokes a 
tales superficiales seguiremos el mismo tipo de razonamiento que en la demostra- 
cion precedente, excepto que usaremos el teorema de Green para regiones multi- 
plemente conexas (teorema 11.12). En lugar de la integral de linea que aparece 
en (12.27) precisamos una suma de integrales de linea, con signos adecuados, to- 
madas sobre las imagenes de las curvas que constituyen la frontera de T. Por 
ejemplo, si T tiene dos agujeros, como en la figura 12.14, y las curvas frontera 
r, r, y T, son recorridas en la direction indicada, la identidad del teorema de 
Stokes toma la forma 

// (rot F)-ndS = j> c F-dp 4-f c F ■ dp 1 + j^F-dp^, 

donde C, C l y C 2 son las imagenes de P, y r 2 respectivamente, y p, pi y p 2 
son las funciones compuestas p(f) = »‘[y(0], Pi(0 = » , [YiM], p 2 (0 = 

Las funciones y , Yi y Ys son las que describen r, T, y P 2 en las direcciones indir 
cadas. Las curvas C, C, y C, seran recorridas en las direcciones inducidas por la 
aplicacion r a partir de T, Tj y P 2 . 

El teorema de Stokes puede tambien extenderse a algunas superficies regula¬ 
rs no simples (pero no a todas). Veamos algunos ejemplos 

Consideremos primero el cilindro dibujado en la figura 12.15. Es la reunion 
de dos superficies parametricas regulares simples Sj y S 2 , imagenes de dos rec- 
tangulos adyacentes T x y T 2 a traves de las aplicaciones iq y r 2 , respectivamente. 
Si Yi describe la frontera r l5 positivamente orientada, de T x yy 2 la frontera P 2 
de T 2 asimismo orientada positivamente, las funciones p x y p 2 definidas por 

Pi(0 = rJYi (t)], p 2 (0 = »* 2 [Y2(0] 


describen las imagenes Ci y C 2 , de P, y r 2 respectivamente. En este ejemplo las 
representaciones y r 2 pueden elegirse de modo que esten de acuerdo en la inter- 



Figura 12.15 Extension del teorema de Stokes a un cilindro. 
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section I\ n r 2 . Si aplicamos el teorema de Stokes a cada parte Sj y S 2 y suma- 
mos las dos identidades, obtenemos: 

(12.51) (rot F)-n 1 dS + //(rot F) ■ n 2 dS = F ■ d Pl + S Ct F ‘d Pi , 

Si s 2 

donde n x y n 2 son las normales determinadas por los productos vectoriales de 
»*i y r 2 , respectivamente. 

Representemos con r la aplicacion de 7) U T 2 que coincide con r r en T i 
y con r 2 en T 2 , y sea n la correspondiente normal unitaria determinada por el 
producto vectorial fundamental r. Ya que las normales n x y n 2 coinciden en direc¬ 
tion en S 1 O 5 2 , u es igual a », en Si e igual a n 2 en S 2 . Por consiguiente, la 
suma de las integrates de superficie del primer ihiembro de (12.51) es igual a 

JJ (rot F)-ndS. 

SikjSz 

En este ejemplo, las representaciones r 1 y r 2 pueden elegirse de modo que pi y p 2 
determinen direcciones opuestas en cada arco de la intersection C l n C 2 , como 
indican las flechas en la figura 12.15. Las dos integrates de linea del segundo 
miembro de (12.51) pueden reemplazarse por una suma de integrates de linea a 
lo largo de las dos circunferencias C\ y C\ que forman el borde superior e infe¬ 
rior de S\ u S 2 , puesto que las integrates de linea a lo largo de cada arco de la 
intersection C 1 n C 2 se reducen. Por lo tanto, la ecuacion (12 51) puede escri- 
birse en la forma 


(12.52) 


If 


(rot F) ■ ndS = 


Si^S 2 




donde las integrates de linea se calculan en las direcciones deducidas de las de 
T 1 y r 2 . Las dos circunferencias C\ y C\ forman la frontera completa de S) u S 2 . 
La ecuacion (12.52) expresa la integral de superficie de (rot F) ■ n sobre Si u S 2 
como una integral de linea sobre la frontera completa de S 1 'J S 2 . Esa ecuacion 
es la extension del teorema de Stokes a un cilindro. 

Supongamos ahora que aplicamos los mismos conceptos a la superficie dibu- 
jada en la figura 12.16. Esta superficie es tambien la reunion de dos superficies 
parametricas regulares simples S x y S 2 , imagenes de dos rectangulos adyacentes 
Tj y T 2 . Esta superficie especial se llama banda de Mobius{*)-, se puede construir 


(*) De A. F. Mobius (1790-1868), discfpulo de Gauss. A ia edad de 26 anos fue desig- 
nado profesor de Astronorru'a en Leipzig, cargo que desempeno hasta su muerte. Trabajo en 
Mecanica celeste, pero sus investigaciones mas importantes versaron sobre temas de Geometrla 
y de Teoria de numeros. 
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Figura 12.16 Banda de Mobius considerada como la reunion de dos superficies parametricas 
simples. El teorema de Stokes no se extiende a una banda de Mobius. 



facilmente un modelo con una tira rectangular de papel dando a uno de los extre- 
mos una media vuelta y soldando los dos hordes. Definimos p 1; p 2 , Ci y C 2 para 
la banda de Mobius como antes se hizo para el cilindro. El borde de S x u S 2 en 
este caso es una curva cerrada simple C, y no dos. Esta curva es el borde comple- 
to de la banda de Mobius. 

Si aplicamos el teorema de Stokes a cada una de las partes S, y S 2 como se 
hizo para el cilindro, obtenemos la ecuacion (12.51). Pero si intentamos mantener 
las dos integrales de superficie y las dos integrales de linea como antes, nos encon- 
tramos con dos dificultades. Primera, las dos normales n± y « 2 no coinciden en 
direccion en toda la intersection C x n C 2 . (Vease figura 12.16.) Por consiguiente, 
no podemos definir una normal n para toda la superficie tomando n — «, en S t 
y n — n 2 en S 2 , como hicimos en el cilindro. Esto no es grave inconveniente, no 
obstante, ya que podemos definir n = n x en S, y en C x nC 2 , y definir entonces 
n = » 2 en el resto. Esto nos da una normal discontinua, pero las discontinuidades 
asi introducidas constituyen un conjunto de medida nula en el piano uv y no 
afectan la existencia o el valor de la integral de superficie 

// ( rot F) ndS. 

S\kjSz 

Una dificultad mas seria encontramos al intentar mantener las integrales de 
linea. En este ejemplo no es posible elegir las aplicaciones r x y r 2 de manera que 
pi y p 2 determinen direcciones opuestas en cada uno de los arcos de la intersec¬ 
cion C x n C 2 . Esto se indica con flechas en la figura 12.16, uno de esos arcos es 
recorrido dos veces en la misma direccion. Sobre este arco las correspondientes 
integrales de lmea no se reduciran necesariamente como ocurrio en el cilindro. Por 
consiguiente, la suma de las integrales de lfnea de (12.51) no son necesariamente 
iguales a la integral de linea sobre la frontera completa de u S 2 , y el teorema , 
de Stokes no puede extenderse a la banda de Mobius. 
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Observation. El cilindro y la banda de Mobius son ejemplos de superficies orien- 
tables y no orientables, respectivamente. No intentaremos definir estos conceptos con 
precisidn, pero mencionaremos algunas de sus diferencias. Para una superficie orienta- 
ble SiUS 2 formada con dos superficies parametricas regulares simples como las des- 
critas antes, las aplicaciones r x y r 2 pueden siempre elegirse de modo que Pi y P 2 
determinen direcciones opuestas sobre cada arco de la interseccion Ci O C 2 . Para 
una superficie no orientable no es posible tal definition de normal. Un modelo en 
papel de una superficie orientable siempre presenta dos caras que pueden distinguirse 
pintandolas con dos colores diferentes. Las superficies no orientables tienen tan 
sdlo una cara. Para hacer un estudio riguroso de estas y otras propiedades de las 
superficies orientables y no orientables, puede consultarse cualquier libro de Topo- 
logia combinatoria. El teorema de Stokes puede extenderse a las superficies orienta¬ 
bles mediante un procedimiento parecido al seguido antes para el cilindro. 


Otra superficie orientable es la esfera dibujada en la figura 12.17. Es la 
reunion de dos superficies parametricas simples (hemisferios) S, y So, que pueden 
considerarse imagenes de un disco circular del piano xy a t raves de las aplicacio¬ 
nes y r 2 , respectivamente. Damos a r, p lf p 2 , C„ C 2 el mismo significado que 
en los ejemplos anteriores. En este caso las curvas C x y C 2 estan identificadas 
por la aplicacion r (coinciden a lo largo del ecuador), y la superficie S 1 U S 2 
se llama cerrada. Ademas, iq y n 2 pueden elegirse de modo que las direcciones 
determinadas por p x y p 2 sean opuestas en C x y C 2 , como se indica con flechas 
en la figura 12.17. (Esto ocurre porque S, u S 2 es orientable.) Si aplicamos el 



Figura 12.17 Extension del teorema de Stokes a una esfera. 


teorema de Stokes a cada hemisferio y sumamos los resultados obtenemos la 
ecuacion (12.51), como antes. Las normales n 1 y rt 2 coinciden en la interseccion 
C l n C 2 , y podemos reunir las integrales sobre Si y S 2 en una sobre toda la esfera. 
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Las dos integrales de lfnea del segundo miembro de (12.51) se reducen, y nos 
queda la formula 


// (rot F)-ndS = 0. 

SlU.?2 

Esto es valido no tan solo para una esfera, sino para toda superficie orientable 
cerrada. 


12.19 Teorema de la divergencia (teorema de Gauss) 

El teorema de Stokes expresa una relacion entre una integral extendida a una 
superficie y una integral de linea tomada sobre la curva o curvas que constituyen 
la frontera de tal superficie. El teorema de la divergencia expresa una relacion 
entre una integral triple extendida a un solido y una integral de superficie tomada 
sobre la frontera de ese solido. 

TEOREMA 12.6. TEOREMA DE LA DIVERGENCIA. Si V es Utl Solido etl E } 
limitado par una superficie orientable S, si n es la normal unitaria exterior a S 
y si F es un campo vectorial definido en V, entonces tenemos 


(12.53) 


fff (div F) dx dy dz = J j F ■ n dS. 
v s 


Observacion. Si expresamos F y n en funcion de sus componentes 


F(x, y, z) = P(x, y, z)i + Q(x, y, z)j + R(x, y, z)k 

y 

n = cos a i + cos flj + cos y k, 
la ecuacion (12.53) puede entonces ponerse en la forma: 

(12.54) jjj* (^~ + + Yz) dx dy dz = JJ ( Pcos “ + Q cos P + R cos y) dS. 

V s 

Demostracion. Bastara establecer las tres ecuaciones 


$fx dxdydz ~H 


P cos a dS, 
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Jiff ? 1dxdy ‘ dl 

s]s a £ dxdyiz 

V 

y sumar los resultados para obtener (12.54). Comenzamos por la tercera de esas 
formulas y la demostramos para solidos de tipo ciertamente especial. 

Supongamos que V es un conjunto de puntos (x, y, z) que satisfacen una re¬ 
lation de la forma 



g(x, y) < z < f{x, y) para (x, y) en T, 

siendo T una region conexa del piano xy, y / y g funciones continuas en T, con la 
condition g(x, y) ^ fix, y) para cada punto (x, y) en T. Geometricamente, esto 
significa que T es la proyeccion de V en el piano xy. Toda recta paralela al eje z 
que atraviese T corta al solido V a lo largo de un segmento rectilineo que une 
la superficie z = g(x, y) a la z = fix, y). La superficie frontera S consta de un 
casquete superior S lt dado en la forma explicita z = fix, y); otro inferior S 2 dado 
por z = g(x, y); y en algunos casos por una porcion de cilindro S 3 engendrado por 
una recta que se mueve a lo largo de la frontera de T manteniendose paralela al 
eje z. La normal exterior a S tiene componente z no negativa en S! y no positiva 
en S 2 y es paralela al piano xy en S 3 . Los solidos de este tipo se llaman «proyec- 
tables-xy». (En la figura 12.18 se muestra un ejemplo.) En el se incluyen todos 


X 



z 




y 


Figura 12.18 Ejemplo de solido proyectable-xy. 
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los solidos convexos (por ejemplo, esferas, elipsoides, cubos) y otros muchos que 
no son convexos (por ejemplo, el toro con eje paralelo al z). 

La idea de la demostracion es sencillfsima. Expresamos la integral triple como 
una doble extendida a la proyeccion T. Entonces demostramos que esta integral 
doble tiene el mismo valor que la integral de superficie citada en el enunciado. 
Comencemos con la formula 


SSi s £ dxdrdz 


rrrr-s* 

JJ L J rj(x.V) BZ 


dx dy. 


La integral unidimensional respecto a z puede calcularse mediante el segundo teo¬ 
rema fundamental del calculo, dandonos 


(12.55) JJJ ^ dx dy dz = JJ {R[x, y,f(x, y)] - R[x, y, g(x, y)]} dx dy. 

v T 

Para la integral de superficie podemos escribir: 

(12.56) JJ R cos y dS = JJ R cos y dS + J J R cos y dS + J J R cos y dS. 

S Si S2 S3 

Sobre S 3 la normal n es paralela al piano xy, de modo que cos y = 0, y la integral 
sobre S s es nula. Sobre la superficie S 3 usamos la representacion 


y sobre S 2 


r(x, y) = xi + yj + fix, y)k, 


r(x, y) = xi + yj + g(x, y)k. 


En Si la normal n tiene la misma direccion que el producto vectorial fundamen¬ 
tal dr/dx x dr/dy, asi podemos escribir [vease ecuacion (12.25)]: 

JJ R cos y dS = j j R dx A dy — j j fl[x, y,f(x, y)] dx dy. 

Si Si T 

En S 2 la normal n tiene direccion opuesta a la de dr/dx x dr/dy de modo que, en 
virtud de (12.26), tenemos, 

JJ R cos y dS — — Jj R dx A dy = — JJ R[x, y, g(x, y)] dx dy. 

Si Si T 
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Por consiguiente, la ecuacion (12.56) se convierte en 


JJ R cos ydS = \j {R[x, y,f(x, y)] - «[x, y, g(x, y)]} dx dy. 

S T 


Comparando esta con la (12.55) vemos que 


III lr dx dy dz = 


If 


R cos y dS . 


s 


En la demostracion anterior la hipotesis de que V es proyectable-xy nos per- 
mite expresar la integral triple extenaida a V como una integral doble sobre su 
proyeccion T sobre el piano xy. Es evidente que si V es proyectable-yz podemos 
razonar del mismo modo y demostrar la identidad 


^f/ xdydz 


II 


P cos a dS : 


y si V es proyectable-xz obtenemos: 


\\\fy dXdydZ 


II 


<2 cos (I dS. 


s 


Asi vemos que el teorema de la divergencia es valido para todos los solidos pro- 
yectables sobre los tres pianos coordenados; en particular, para todo solido 
convexo. 

Un toro con el eje paralelo al eje z es proyectable-xy pero no proyectable-xz 
ni proyectable-yz. Para extender el teorema de la divergencia a ese solido cortamos 
el toro en cuatro partes iguales por medio de pianos que pasan por su eje y para- 
lelos a los pianos xz e yz, respectivamente, y aplicamos el teorema a cada una de 
las partes. La integral triple sobre el toro completo es la suma de las integrales 
triples sobre las cuatro partes. Cuando sumamos las integrales de superficie sobre 
las cuatro partes encontramos que las aportaciones de las caras comunes a las 
partes adyacentes se reducen unas con otras, puesto que las normales exteriores 
tienen direcciones opuestas sobre un par de tales caras. Por lo tanto, la suma de 
las integrales de superficie sobre las cuatro partes es igual a la integral de super¬ 
ficie sobre el toro completo. Este ejemplo hace ver como el teorema de la diver¬ 
gencia puede extenderse a ciertos solidos no convexos. 
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12.20 Aplicaciones del teorema de la divergencia 

Los conceptos de rotacional y divergencia de un campo vectorial F = Pi + 
Qj + Rk se introdujeron en la seccion 12.12 mediante las formulas 


( 12 . 57 ) 

y 

( 12 . 58 ) 


div F = 


dP 

dx 


dQ dR 
dy dz 


rot 






Para calcular div F y rot F a partir de esas formulas se necesita el conocimiento 
de los componentes de F. Esos componentes, a su vez, dependen de la eleccion de 
los ejes coordenados en E 3 . Un cambio en la position de los ejes coordenados sig- 
nificaria un cambio en los componentes de F y, como cabe esperar, el correspon- 
diente cambio en las funciones div F y rot F. Con la ayuda del teorema de Stokes 
y del de la divergencia podemos obtener formulas para la divergencia y el rotacio¬ 
nal en las que no intervienen los componentes de F. Estas formulas demuestran 
que el rotacional y la divergencia representan propiedades intrinsecas del campo 
vectorial F y no dependen de la eleccion que se haga de los ejes coordenados. 
Vamos a tratar primero la formula para la divergencia. 


teorema 12.7. Sea V(t) una esfera de radio t > 0 con centro en el punto 
a de E 3 , y representemos con S(t) la frontera de V(t). Sea F un campo vectorial 
derivable con continuidad en V(t). Entonces si V(t) representa el volumen de 
V(t), y n la normal unitaria exterior a S, tenemos 


(12.59) 


div F(a) = lim- 

inoi 


II f - ds - 

S(t) 


Demostracion. Sea <p = div F. Si e > 0 tenemos que encontrar un 8 > 0 
tal que 


(12.60) 



1 

inoi 


S(f) 


< € siempre que 


0 < t < <5. 


Puesto que <pe s continua en a, para el e dado existe una 3-esfera B(a; h) tal que 


|9 >(jc) — <?(a) | < - siempre que x e B(a; h). 
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Por consiguiente, si escribimos 95 (a) = <p(x) + [ 97 (a) — <p(x)] e integramos ambos 
miembros de esta ecuacion sobre la esfera V(t) de radio t < h, encontramos 


97 (a) |K(f)| = JJJ (p(x) dx dydz + J JJ [ 97 (a) - (p(x)} dx dy dz. 
ru) r(t ) 

Si aplicamos el teorema de la divergencia a la primera integral triple del segundo 
miembro y pasamos este termino al primer miembro, obtenemos la relacion, 


97 (a) | K(t)| 


-//■ 

su) 


FndS 


< JJJ \<f(a) - r f(x)\ dx dy dz < ^\V(t)\ < e |K(t)|. 

VU) 


Cuando dividimos esta desigualdad por jV(/)l vemos que (12.60) es cierta para 
8 = h. Esto demuestra el teorema. 

En la demostracion anterior no hacemos uso especial del hecho de que V(t) 
fuese una esfera. El mismo teorema subsiste si, en lugar de esferas, utilizamos 
cualquier conjunto de solidos V(t) para los que el teorema de la divergencia es 
valido, con tal que esos solidos contengan el punto a y tiendan hacia a cuando 
t -» 0. Por ejemplo, cada V(t) podria ser un cubo inscrito en una esfera de radio t 
en torno de a; se aplicaria exactamente la misma demostracion. 

El teorema 12.7 puede tambien justificarse con razones fisicas. Supongamos 
que F representa el vector densidad de flujo de una corriente estacionaria. La 
integral de superficie JJ F ■ n dS mide entonces la masa total de fluido que atra- 

SU) 

viesa S en la unidad de tiempo y en la direccion de n. El cociente JJ F ■ n dS/\ V(t)\ 

SU) 

representa la masa por unidad de volumen que fluye a traves de S en la unidad 
de tiempo en la direccion de n. Cuando t 0, el lfmite de ese cociente es la 
divergencia de F en a. Luego la divergencia en a puede interpretarse como el 
coeficiente de variacion de masa por unidad de volumen y por unidad de tiem¬ 
po en a. 

En algunos libros de Analisis vectorial, la ecuacion (12.59) se toma como 
definicion de divergencia. Esto permite inmediatamente asignar un significado 
fisico a la divergencia. Ademas, en la formula (12.59) no intervienen los compo- 
nentes de F. Por lo tanto, es valida en cualquier sistema de coordenadas. Si ele- 
gimos como V(t) un cubo con sus aristas paralelas a los ejes xyz y con centro 
en «, podemos utilizar la ecuacion (12.59) para deducir la fdrmula (12.57) que 
expresa la div F en funcion de los componentes de F. Este procedimiento se 
esboza en el ejercicio 14 de la seccion 12.21. 
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Existe una formula analoga a la (12.59) que a veces se usa como otra defi- 
nicion de rotacional. Dicha formula es: 


(12.61) rot F(a ) = lim—-— n x F dS, 

f-»o |K(t)| *'•' 

SU) 

donde V(t) y S(t) tienen el mismo significado que en el teorema 12.7. La integral 
de superficie que aparece en el segundo miembro tiene un integrando vectorial. 
Tales integrales pueden definirse en funcion de los componentes. La demostra- 
cion de (12.61) es analoga a la del teorema 12.7. 

Existe otra formula en la que interviene el rotacional y que puede deducirse 
de (12.61) o bien directamente. Tal forma establece que 

(12.62) « • rot F(a) = lim —f— <£ F-da. 

«-o |S(t)| Jem 

En esta formula, S(t ) es un disco circular de radio t y centro en a, y S(t) repre- 
senta su area. El vector n es la normal unitaria a S(t), y a es la funcion que des¬ 
cribe C(t) en una direccion tal que vista desde el extremo de n parece contraria 
a la de las agujas del reloj. El campo vectorial F se supone derivable con conti- 
nuidad en S(t). Puede darse una demostracion de (12.62) con el mismo metodo 
usado para demostrar (12.59). Ponemos <p{x) — n • rot F(x) y razonamos como 
antes, salvo que empleamos integrales de superficie en lugar de integrales triples 
y el teorema de Stokes en lugar del de la divergencia. 

Si F es un campo de velocidad, la integral de lfnea sobre C(t) se llama circu-. 
lacion de F a lo largo de C(t); el lfmite de (12.62) representa la circulation por 
unidad de area en el punto a. De este modo, n • rot F (a) puede considerarse como 
una «densidad de circulacion» de F en el punto a, con respecto a un piano per¬ 
pendicular a n en a. 

Cuando n toma sucesivamente los valores i, j, y k, los productos interiores 
/ • rot jF, j - rot F, y k • rot F son los componentes de rot F en coordenadas rec- 
tangulares. Cuando la ecuacion (12.61) se toma como punto de partida de la defi- 
nicion de rotacional, la formula (12.58) de los componentes rectangulares de 
rot F pueden deducirse de (12.62) exactamente del mismo modo. 

12.21 Ejercicios 

1. Sea S la superficie del cubo unidad 0<x<l,0<y<l, 0<z<l, y sea n la normal 
unitaria exterior a S. Si F(x,y,z) — x 2 i+ y 2 j+z 2 k, empleamos el teorema de la divergen¬ 
cia para calcular la integral de superficie j/F- n dS. Comprobar el resultado calculando 

s 

la integral de superficie directamente. 

2. Se. corta la esfera x 2 + y 2 4- z- = 25 por el piano z = 3. La parte menor es un soli- 
do V limitado por una superficie So constituida por dos partes, una esferica Si y otra 
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plana S 2 . Si la normal unitaria exterior a V es cos a/ + cos pj + cos y k , calcular el 
valor de la integral de superficie 


JJ 


(xz cos a + yz cos fi + cos y) dS 


si a) S es el casquete esferico Si, b) S es la base plana S 2 , c) S es la frontera completa 
So. Resolver la parte c) con los resultados de las partes a) y b), y tambien usando el 
teorema de la divergencia. 

3. Sea n = cos a i + cos Pj 4- cos y k la normal unitaria exterior a una superficie cerra- 
da S que limita un solido homogeneo V del tipo descrito en el teorema de la divergen¬ 
cia. Supongamos que el centro de gravedad (x,y, z) y el volumen |V| de V son conoci- 
dos. Calcular las siguientes integrales de superficie en funcion de |V| y de x,y,z. 


a) JJ ( x cos a + y cos P + z cos y) dS. 
s 


b) JJ (xz cos a + lyz cos p + 3z 2 cos 7 ) dS. 
s 


c) JJ (y 2 cos a + 2 xy cos P — xz cos 7 ) dS. 
s 

d) Expresar JJ (jc 2 + y 2 )(xi + yj) ■ ndS en funcion del volumen V y un momenta de 

s 

inercia del solido. 

En los ejercicios del 4 al 10, df/dn y dg/dn indican las derivadas direccionales de los 
campos escalares / y g en la direccion de la normal unitaria exterior n a una superficie 
cerrada S que limita un solido V del tipo descrito en el teorema de la divergencia. Esto 
es, df/dn = V/ • n y dg/dn = Vg n. En cada uno de los ejercicios demostrar la igualdad 
que se da. Sc puede suponer la continuidad de todas las derivadas que intervienen. 


4. 


| Y n ds = JJJ ^-fdx dy dz. 

s v 



s 


siempre que / sea armonica en V. 


6 ' - jjl ' f*'S dxd y dz + K f v g^dydi. 

7 ' ||(/t s I)" - HI </ v 'r 

S V 


8 . 



/* (* 

J «. 


df 

*i ds 


si / y g son ambas armonicas en V. 



Ejercicios 


565 


9. 


jjfy n ds = Jffwi'dxdydz 

s v 


si f es armonica en V. 


10. V 2 /Y«) = lim——; fl 4-dS, donde V(t) es una esfera de radio r y centra en a, 

t-.o I m\ JJ dn 

SU) 

S(0 es la superficie de V(t), y |V«)i es el volumen de V(D- 

11. Sean V una region convexa de E \s cuya frontera es una superficie cerrada S y n la normal 
unitaria exterior a S. Sean F y G dos campos vectoriales derivables con continuidad 
tales que 


rot F = rot G y div F = div G en todo V, 
y que satisfacen 

G ■ n — F ■ n en toda la superficie S. 

Demostrar que F = G en todo V. [Indication. Sea H = F — G , encontrar un campo 
escalar / tal que H = V/, y usar una identidad adecuada para demostrar que 
JIJ \\^f\\ 2 dxdydz = 0. De esto se deduce que H = O en V.] 
v 

12. Dados un campo vectorial G y dos campos escalares / y g, ambos derivables con con¬ 
tinuidad en un solido convexo V limitado por una superficie cerrada S. La normal uni¬ 
taria exterior a S la representamos con n. Demostrar que existe por lo menos un campo 
vectorial F que satisface las tres condiciones siguientes: 


rot F = G y div F = g en V, F • n = f sobre S. 

13. Sea S una superficie parametrica regular con la propiedad de que cada recta que pasa por 
P corta a S una vez a lo sumo. Representemos con Q(S) el conjunto de rectas que 
pasando por P atraviesan S. (Vease figura 12.19.) El conjunto S2(S) se llama angulo solido 
de vertice en P subtendido por S. Sea 2(a) la interseccion de S2(S) en la superficie de la 
esfera de radio a y centra en P. El cociente 


area de 2(a) 


que se representa por 'fi(S) y se utiliza como medida del angulo solido I2(S). 
a) Demostrar que este cociente es igual a la integral de superficie 


II 


r ■ n 

— dS, 
r 


donde r es el radio vector que une P a un punto cualquiera de S, y r =||r|| .El vector n 
es la normal unitaria a S en la direccion de alejamiento de P. Esto muestra que el 
cociente S2(S)| es independiente del radio a. Por consiguiente, el angulo solido puede ser 
medido por el area de la interseccidn de fi(S)y la esfera unidad en torno a P. [Indica¬ 
tion. Aplicar el teorema de la divergencia a la porcion de S2(S) qomprendida entre 
S y 2(a).] 
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Figura 12.19 Angulo solido fi(S) con vertice en P subtendido por una superficie S. 


Su medida viene dada por el cociente |f2(S)| = 


area de 2(a) 


a 


2 


b) Dos pianos se cortan a lo largo de un diametro de una esfera con centro en P. 
El angulo de intersection es 9, siendo 0 < 0 < tt. Sea S la parte menor de la superficie 
de la esfera interceptada por los dos pianos. Demostrar que |S2(S)| = 29. 

14. Sean V(t) un cubo de arista 2t y centro en a, y S(t) la frontera del citado cubo. Como 
de costumbre n es la normal unitaria exterior a S(t) y sea jV(/)| el volumen del cubo. 
Para un campo vectorial dado F diferenciable con continuidad en a, suponer que existe 
el siguiente limite: 


SU) 

y emplearlo como definition de div F(u). Elegidos unos ejes coordenados xyz paralelos 
a las aristas de V(t), sean P, Q y R los componentes de F relativos a ese sistema de 
coordenadas. Demostrar que div F(a) = Z^Pfa) + D 2 Q(a) + D z R(a). Undicacidn. Ex- 
presar la integral de superficie como suma de seis integrales dobles tomadas sobre las 
caras del cubo. Demostrar entonces que \/\V(t)\ multiplicado por la suma de las dos 
integrales dobles sobre las caras perpendiculares al eje z tiende al limite D s R(a ) cuando 
f —* 0. Razonar de modo parecido para los restantes terminos.] 
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15. Un campo escalar <p tiene la propiedad 

\W<p\\ 2 =4<P y div (<pV<p) = lOy. 
Calcular la integral de superficie 



8 


donde S es la superficie de la esfera unidad con centro en el origen, y 3<p/3n es la deri- 
vada direccional de <p en la direccion de la normal unitaria exterior a S. 
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FUNCIONES DE CONJUNTO 
Y PROBABILIDAD ELEMENTAL 


13.1 Introduction histories 

Una disputa entre jugadores en 1654 llevo a dos famosos matematicos fran- 
ceses, Blaise Pascal y Pierre de Fermat, a la creation del Calculo de probabilida- 
des. Antoine Gombaud, caballero de Mere, noble frances interesado en cuestiones 
de juegos y apuestas, llamo la atencion a Pascal respecto a una aparente contra¬ 
diction en un popular juego de dados. El juego consistfa en lanzar 24 veces un 
par de dados; y el problema en decidir si era lo mismo apostar la misma cantidad 
a favor o en contra de la aparicion por lo menos de un «doble seis» en las 24 
tiradas. Una regia del juego aparentemente bien establecida condujo a de Mere a 
creer que apostar por un doble seis en 24 tiradas era ventajoso, pero sus propios 
calculos indicaban justamente lo contrario. 

Este y otros problemas planteados por de Mere motivaron un intercambio de 
cartas entre Pascal y Fermat en las que por primera vez se formularon los princi- 
pios fundamentales del Calculo de prebabilidades. Si bien unos pocos problemas 
sobre juegos de azar habian sido resueltos por matematicos italianos en los si- 
glos xv y xvi, no existia una teoria general antes de esa famosa correspondence. 

El cientffico holandes Christian Huygens, maestro de Leibniz, enterado de 
esa correspondencia publico rapidamente (en 1657) el primer libro de probabili- 
dades; titulado De Ratiociniis in Ludo Aleae, fue un tratado de problemas rela- 
cionados con los juegos. El Calculo de probabilidades llego a ser pronto popular 
por sus alusiones a los juegos de azar, y se desarrollo rapidamente a lo largo del 
siglo xviii. Quienes mas contribuyeron a su desarrollo en ese periodo fueron Jakob 
Bernoulli (*) (1654-1705) y Abraham de Moivre (1667-1754). 

En 1812, Pierre de Laplace (1749-1827) introdujo gran cantidad de ideas 
nuevas y tecnicas matematicas en su libro, Theorie analytique des probabilites. An- 

(*) Citado algunas veces como James Bernoulli. 
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tes de Laplace, el Calculo de probabilidades practicamente consistia en un ana- 
lisis matematico de los juegos de azar. Laplace demostro que esa teoria podia 
ser aplicada a multitud de problemas cientificos y practicos. Ejemplos de tales 
aplicaciones son la teoria de errores, la matematica actuarial y la mecanica estadis- 
tica que se desarrollaron en el siglc xix. 

A1 igual que ha ocurrido con otras muchas ramas de la Matematica, el de- 
sarrollo del Calculo de probabilidades ha sido estimulado por la variedad de sus 
aplicaciones. Inversamente, cada avance en la teoria ha ampliado el campo de su 
influencia. La Estadfstica Matematica es una rama importante del Calculo de 
probabilidades aplicado; otras aplicaciones las tenemos en campos tan distintos 
como la Genetica, la Psicologfa, la Economia y la Ingenieria. Muchos autores han 
contribuido al desarrollo de la teoria desde el tiempo de Laplace; entre los mas 
importantes estan Chebyshev, Markov, von Mises y Kolmogorov. 

Una de las dificultades que se presentaron al desarrollar una teoria matema¬ 
tica de la teoria de la probabilidad ha sido alcanzar una definicion de probabili¬ 
dad lo bastante precisa para su utilization matematica, pero lo bastante amplia 
para que sea aplicable a un numero de fenomenos lo mayor posible. La busqueda 
de una definicion completamente aceptable duro cerca de tres siglos y fue carac- 
terizada por gran numero de controversias. El asunto fue definitivamente resuelto 
en el siglo xx al tratar la teoria de la probabilidad en forma axiomatica. En 1933 
una monografia del matematico ruso A. Kolmogorov establecio una introduction 
axiomatica que constituyo la base para la moderna teoria. (La traduction inglesa 
de la monografia de Kolmogorov se titula Foundations of Probability Theory, 
Chelsea, New York, 1950.) Desde entonces las ideas se han ido afinando algo 
mas y hoy dia la teoria de la probabilidad es parte de una disciplina mas general 
que es la teoria de la medida. 

Este capitulo presenta las nociones fundamentales de la moderna teoria de la 
probabilidad elemental junto con sus conexiones con la teoria de la medida. Tam- 
bien se dan algunas aplicaciones, especialmente a los juegos de azar tales como 
lanzamiento de monedas, dados y juegos de naipes. Esta exposition pretende 
poner de manifiesto la estructura logica del tema como ciencia deductiva y suscitar 
en el lector el interes en el modo de pensar probabilistico. 

13.2 Funciones de conjunto con aditividad finita 

El area de una region, la longitud de una curva, o la masa de un sistema de 
particulas son numeros que miden la magnitud o contenido de un conjunto. Todas 
esas medidas tienen ciertas propiedades comunes. Establecidas en forma abstracta, 
conducen a un concepto general llamado funcion de conjunto con aditividad finita. 
Mas adelante introduciremos la probabilidad como otro ejemplo de una funcion 
de este tipo. Para preparar el camino, discutimos primero algunas propiedades 
comunes a todas esas funciones. 
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Una funcion f: si R cuyo dominio es una coleccion i de conjuntos y cu- 
yos valores son numeros reales, se llama funcion de conjunto. Si A es un conjunto 
de la coleccion si, el valor de la funcion en A se representa por f(A). 

DEFINICION DE FUNCION DE CONJUNTO CON ADITIVIDAD FINITA. Una funcion 
de conjunto f: si R se dice que es de aditividad finita si 

(13.1) f(A U B) =f(A) + f(B) 

siempre que A y B sean conjuntos disjuntos en si tales que A U B pertenezca 
tambien a si. 

El area, la longitud y la masa son ejemplos de funciones de conjuntos con 
aditividad finita. En esta seccion se discuten consecuencias de la ecuacion (13.1). 

En las aplicaciones corrientes, los conjuntos de si son subconjuntos de un 
conjunto dado S, llamado conjunto universal. Es frecuente tener que efectuar las 
operaciones de reunion, intersection y complementacion sobre los conjuntos de 
si . Para asegurarse de que si es cerrado respectc a esas operaciones imponemos 
a si que sea un algebra booleana, que se define como sigue. 

DEFINICION DE UN ALGEBRA BOOLEANA DE CONJUNTOS. Una clase KO VaClO si 
de subconjuntos de un conjunto universal S se llama algebra booleana si para todo 
par A y B de conjuntos de si tenemos 

A u Be si y A' e si . 

Aqui A’ — S - A, es el complemento de A respecto a S. 

Un algebra booleana si tambien es cerrada para las intersecciones y dife- 
rencias, ya que tenemos 

A n B = (A’ U B'Y y A - B = A C\B’. 

Esto implica que el conjunto vacio 0 pertenece a si ya que 0 = A — A para 
algun A de si. Tambien el conjunto universal S pertenece a si puesto que 
S = 0'. 

A partir de los subconjuntos de un conjunto universal dado S pueden cons- 
truirse gran numero de algebras bcoleanas. La menor de esas algebras es la clase 
r j — { 0, s}, que consta tan solo de dos subconjuntos especiales: 0 y S. En el 
otro extremo esta la clase si 1 , que consta de todos los subconjuntos de S. Toda 
algebra booleana si constituida con subconjuntos de S satisface las relaciones de 
inclusion si 0 £ si £ si x . 
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La propiedad de la adidvidad finita de funciones de conjunto de la ecuacion 

(13.1) exige que A y B sean conjuntos disjuntos. De esta exigencia se desprende 
el teorema siguiente. 

teorema 13.1. Si f-.stf -+ Res una funcion de conjunto con aditividad 
finita definida sobre un algebra de Boole srf de conjuntos, entonces para todo 
par de conjuntos A y B de s# tenemos 

(13.2) f(AKJB)=f{A)+f{B-A), 

y 

(13.3) RAKJB)= f(A) + RB) - f(A n B). 

Demostracidn. Los conjuntos A y B — A son disjuntos y su reunion es 
A U B. Luego, aplicando (13.1) a A y a B — A obtenemos (13.2). 

Para demostrar (13.3) observemos primero que A n B' y B son conjuntos 
disjuntos cuya reunion es A U B. Por tanto segun (13.1) tenemos 

(13-4) f(A u B) — f {A n B’) + f(B). 

Asimismo, A n B' y A nfi son conjuntos disjuntos cuya reunion es A, con lo que 
(13.1) nos da 

(13.5) f(A) =f(A n 5') +f{A n B). 

Restando (13.5) de (13.4) obtenemos (13.3). 

13.3 Medidas con aditividad finita 

Las funciones de conjunto que representan areas, longitudes y masas poseen 
propiedades comunes. Por ejemplo, son todas funciones de conjunto no negativas. 
Esto es, 


KA) > 0 

para cada conjunto A de la clase que se considera. 

definicion de medida con aditividad finita. Una funcion de conjunto 
no negativa f: . r /J -±R que es con aditividad finita se dice que es una medida con 
aditividad finita, o simplemente una medida. 

Aplicando el teorema 13.1 obtenemos inmediatamente las siguientes propie¬ 
dades de las medidas. 
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teorema 13.2. Sea f: -sJ - -* R una medida con aditividad finita definida 
sobre un algebra booleana -s#. Para todos los conjuntos Ay B de tenemos 

a) f(A U B) < f(A) +f(B). 

b) f(B - A) = f(B) - f(A) si A^B. 

c) /(A) < f(B) si A £ B. (Propiedad de monotonia) 

d) /( 0 ) = O. 

Demostracidn. La parte a) se deduce de (13.3), y la parte b) de (13.2). 
La parte c) resulta de b), y d) se obtiene haciendo A =B = 0 en b). 

E[em pro. Numero de elementos de un conjunto finito. Sea S = {a lt a 2 ,..., 
a n } un conjunto que consta de n elementos distintos, y sea la clase de todos 
los subconjuntos de S. Para cada A de s/, representemos por v(yi) el numero de 
elementos distintos de A (v es la letra griega «ni»). Es facil verificar que esta 
funcion es de aditividad finita en sA. En efecto, si A tiene k elementos y B m ele¬ 
mentos, v(/4) = k y v(B) — m. Si A y B son disjuntos es evidente que A U B es 
un subconjunto de S con k + m elementos, asf que 

v(A U B) = k + m = v(A) + v{B). 


Esta funcion de conjunto es no negativa, con lo que v es una medida. 

13.4 Ejercicios 

1. Representemos por sf la clase de todos los subconjuntos de un conjunto universal dado 
y sean A y B conjuntos cualesquiera de sj. Demoslrar que: 

a) A n S' y B son disjuntos. 

b) A B — (A r\ B') V) B . (Esta formula expresa A u B como reunion de dos con¬ 
juntos disjuntos.) 

c) A n B y A rv B son disjuntos. 

d) (A n B) u (A n B') — A . (Esta formula expresa A como reunion de dos conjuntos 
disjuntos.) 

2. El ejercicio 1 b) nos muestra la posibilidad de expresar la reunion de dos conjuntos 
como reunion de dos conjuntos disjuntos. Expresar de manera parecida la reunion de 
tres conjuntos A t u A 2 u A 3 y, mas general, de n conjuntos A x U A 2 u ■ • • u A n . 
Ilustrar con un diagrama el caso n — 3. 

3. A1 estudiar el conjunto S que consta de 1000 graduados universitarios diez anos despues de 
su graduacion, se observo que los «triunfantes» formaban un subconjunto A de 400 miem- 
bros, los graduados por Caltech otro B de 300, y la interseccion A n $constaba de 200. 
a) Empleando la notacion de la teoria de conjuntos y los conceptos de reunion e inter¬ 
seccion de A, B y sus complementarios A' y B' respecto de S, expresar los subconjuntos 
de aquellas personas de S que poseen las caracteristicas siguientes: 

i) Ni «triunfantes» ni graduados por Caltech. 

II) «Triunfantes» pero no graduados por Caltech. 
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in) «Triunfantes» o graduados por Caltech o ambas cosas. 
iv) «Triunfantes» o graduados por Caltech pero no ambas cosas. 
v) Pertenecen tan solo a uno de los subconjuntos A o B. 
b) Determinar el numero exacto de individuos de cada uno de los cinco subconjuntos 
anteriores. 

4. Sea / una funcion de conjunto de aditividad finita defmida en una clase de conjuntos si. 
Sean A\,... ,A„ n conjuntos de si tales que A, (1 A, = 0 si i ^ j. (Una tal coleccion 

se denomina coleccion disjunta de conjuntos.) Si la reunion (J A k pertenece a si para 

*=i 

todo m < n, utilizar el metodo de induccion para demostrar que 

flu A.) = i/04*). 

\*-i / *=i 

En los ejercicios 5, 6 y 7 , S representa un conjunto finito que consta de n elementos 
distintos, sea S = {«i, 02 . • • • > «»}. 

5. Sea Ai = {at}, el subconjunto que consta del unico elemento zq. Demostrar que la 
clase id x = {0,Ai,Ai,S} es la mas pequena algebra de Boole que contiene A k . 

6. Sean A i = {ai}, A% = { 02 }. En forma parecida a la utilizada en el ejercicio 5, descri- 
bir la mas pequena algebra de Boole id 2 que contenga Ai y A 2 . 

7. Hacer lo mismo que en el ejercicio 6 para los subconjuntos Ai = {ai}, A 2 = {ao} y 
^3 = {^3}. 

8. Si 38 k representa la minima algebra de Boole que contiene los k subconjuntos A\ = {ai), 
A 2 = { 02 },..., A k = {a t }, demostrar que ,id k contiene 2 k+1 subconjuntos de S si 
k < n y 2" subconjuntos si k — n. 

9. Sea / una funcion de conjunto con aditividad finita definida sobre el algebra booleana 
de todos los subconjuntos de un conjunto universal dado S. Supongamos que 


f{A n B) = f(A)f(B) 


para dos subconjuntos particulares A y B de S. Si /(S) = 2, demostrar que 
f{A uB) =f(A') + f(B’) — f(A')f(B'). 


10. Si A y B son dos conjuntos, su diferencia simetrica A A B es el conjunto definido por 
A A B={A — B) u (B — A). Demostrar cada una de las siguientes propiedades de la 
diferencia simetrica. 

a) A A B = B A A. 

b) A A A = 0 . 

c) A A B c (A A C) U (C A B). 

d) A A B es disjunto con la interseccion de A y B. 

e) (A A B) A C = A A (B A C) . 

f) Si / es una funcion de conjunto con aditividad finita definida sobre el algebra de 
Boole si de todos los subconjuntos de un conjunto dado S, entonces para todo par 
A y B de si tenemos f(A A B)= f(A) + /(B) - 2 f(A n B). 
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13.5 Definicion de probabilidad para espacios muestrales finitos 


En el lenguaje de las funciones de conjunto, la probabilidad es un tipo espe¬ 
cial de medida (representada aqui por P ) definida sobre una particular algebra 
booleana 39 de conjuntos. Los elementos de :'A son subconjuntos de un conjun¬ 
to universal S. En la teoria de la probabilidad el conjunto universal S se llama 
espacio muestral. Primero comentaremos la definicion de probabilidad para es¬ 
pacios muestrales finitos y luego lo haremos para los infinitos. 

DEFINICION DE PROBABILIDAD PARA ESPACIOS MUESTRALES FINITOS. Sea - J A 
un algebra de Boole cuyos elementos son subconjuntos de un conjunto finito dado 
S. Una funcion de conjunto P definida en 39 se llama medida de probabilidad 
si satisface las tres condiciones siguientes: 

a) P es de aditividad finita. 

b) P es no negativa. 

c) PIS) = 1. 

Dicho de otro modo, para los espacios muestrales finitos la probabilidad es 
simplemente una medida que asigna el valor 1 al espacio completo. 

Importa darse cuenta de que para una description completa de la medida de 
probabilidad deben precisarse tres ideas: el espacio muestral S, el algebra de 
Boole 39 constituida con ciertos subconjuntos de S, y la funcion de conjunto P. 
La terna (S,39, P) se denomina frecuentemente espacio de probabilidad. En la ma- 
yorfa de las aplicaciones elementales el algebra de Boole -39 es la coleccion de 
todos los subconjuntos de S. 

ejemplo. El juego de «cara o cruz» es una aplicacion de la teoria de pro¬ 
babilidad. Como espacio muestral S tomamos el conjunto de todos los resultados 
posibles en el juego. Cada resultado es o «cara» o «cruz» que representamos con 
los sfmbolos h y t. Dicho espacio muestral es pues {h, t} es decir, el conjunto que 
consta de h y t. Como algebra booleana consideramos la coleccion de todos los 
subconjuntos de S; estos son cuatro, 0, S, H y T, donde H = {h} y T = {t}. 
Asignemos ahora probabilidades a cada uno de esos subconjuntos. Para 0 y S 
■no tenemos option a elegir valores de probabilidad. Por la propiedad b), P(S) = 1, 
y como P es no negativa, P{0) = 0. En cambio, tenemos libertad en la asignacion 
de la probabilidad a los otros dos subconjuntos, H y T. Ya que H y T son con- 
juntos disjuntos cuya reunion es S, la propiedad aditiva exige que 

P(H) + P{T ) = P(S) = 1. 

Como valores de P(H) y P(T) podemos tomar valores cualesquiera no negativos 
pon tal de que su suma sea 1. Si tenemos en cuenta que la moneda es imparcial 
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de modo que no existe razon a priori para preferir cara o cruz, parece natural 
asignar Ios valores 


P(H) = P(T) = >. 

Si, en cambio, la moneda no es geometricamente perfecta, podremos asignar valores 
diferentes a esas dos probabilidades. Por ejemplo, los valores P(H) = ' y P(T ) = § 
son tan aceptables como P(H) — P(T ) = |. En efecto, para todo numero real p 
en el intervalo podemos definir P(H) — p y P(T) = 1 — p, y la funcion 

resultante P satisfara todas las condiciones que se exigen a una medida de proba¬ 
bilidad. 

Para una moneda determinada, no existe un metodo matematico para precisar 
cual es la probabilidad p «real». Si escogemos p = \ podemos deducir consecuen- 
cias logicas en la hipotesis de que la moneda es correcta y no presenta sesgo. 
La teoria desarrollada para el estudio de las probabilidades en monedas correctas, 
puede utilizarse como test comprobatorio de su carencia de sesgo, efectuando un 
gran numero de experiencias con ella y comparando los resultados experimentales 
con las predicciones teoricas. El poner de acuerdo la teoria y la evidencia empf- 
rica pertenece a la rama de aplicacion de la teoria de la probabilidad que se llama 
inferencia estadistica, y que no expondremos en este libro. 

El ejemplo anterior es una tipica aplicacion del Calculo de probabilidades. 
Las cuestiones probabilisticas se presentan a menudo en situaciones llamadas 
«experimentos». No intentaremos definir un experimento; en cambio, mencionare- 
mos tan solo algunos ejemplos corrientes: lanzar una o varias monedas, echar un 
par de dados, repartir una mano de bridge, sacar una bola de una urna, recuento 
de las muchachas estudiantes en el Institute Tecnologico de California, selection 
de un numero en una guia telefonica, registro de la radiacion en un contador 
Geiger. 

Para discutir las cuestiones de probabilidad que surgen en tales experimentos, 
nuestro primer trabajo es la construction de un espacio muestra S que pueda utili¬ 
zarse para representar todos los resultados posibles del experimento, como hicimos 
en el juego de cara y cruz. Cada elemento de S representara un resultado del expe¬ 
rimento y cada resultado corresponded a uno y solo un elemento de S. A continua- 
ci6n, elegimos un algebra de Boole dd de subconjuntos de S (casi siempre todos los 
subconjuntos de S) y entonces se define una medida de probabilidad P sobre dd. 
La eleccion de S,dd, y P depended de la information que se posea acerca de los 
detalles del experimento y del problema que nos vamos a plantear. El objeto del 
Calculo de probabilidades no es discutir si el espacio de probabilidad ( S , ■%, P) ha 
sido elegido correctamente. Esto pertenece a la ciencia o juego del que el experi¬ 
mento ha surgido, y tan solo la experiencia puede darnos idea de si la eleccion fue 
bien hecha o no lo fue. El Calculo de probabilidades es el estudio de las conse- 
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cuencias logicas que pueden deducirse una vez esta dado el espacio de probabili- 
dad. La eleccion de un buen espacio de probabilidad no es teoria de probabilidad 
— ni siquiera es matematica; es, en cambio, parte del arte de aplicar la teoria 
probabih'stica al mundo real. 

Si S = {a u a 2 ,. . . ,a„}, y si 3d consta de todos los subconjuntos de S, la 
funcion de probabilidad P esta completamente determinada si conocemos sus va- 
lores para los conjuntos de un solo elemento, 

P({aJ),P({a 2 }),...,P({aJ). 


En efecto, todo subconjunto A de S es una reunion disjunta de los conjuntos ante- 
riores, y P(A) esta determinada por la propiedad aditiva. Por ejemplo, cuando 


A = {a t } u {a 2 } U • • • U {a k }, 
la propiedad aditiva exige que 

PM) = ip(K}). 

i= 1 

Para simplificar la notation y la terminologia, escribimos P{ai) en lugar de P({a,}). 
Este numero tambien se llama probabilidad del punto at. Por lo tanto, la asignacion 
de la probabilidad puntual P(x) a cada elemento x de un conjunto finito S equivale 
a una description completa de la funcion de probabilidad P. 

13.6 Terminologia propia del calculo de probabilidades 

Cuando se habla de probabilidades, a menudo se oyen frases tales como «dos 
sucesos son igualmente probables», «un suceso es imposible», o «un suceso es 
cierto». Las expresiones de este tipo tienen sentido intuitivo y es agradable y util 
saber emplear un lenguaje tan lleno de colorido en las discusiones matematicas. 
Antes de hacerlo asi, no obstante, es necesario exponer el significado de este len¬ 
guaje usando los conceptos fundamentales de nuestra teoria. 

Debido a que el metodo probabilistico se usa en cuestiones practicas, es conve- 
niente imaginarse que cada espacio de probabilidad (S, Sd, P) esta asociado a un 
experimento real o ideal. El conjunto universal S puede entonces concebirse como 
la coleccion de todos los resultados imaginables del experimento, como en el ejem¬ 
plo de la moneda comentado en la seccion precedente. Cada elemento de S se llama 
resultado o muestra y los subconjuntos de S que se presentan en el algebra de 
Boole Sti se denominan sucesos. Los motivos de esta terminologia se pondran en 
evidencia al tratar algunos ejemplos. 

Supongamos un espacio de probabilidad (S, 3d, P) asociado a un experimento. 
Sea A un suceso, y supongamos que el experimento se lleva a cabo y que su resul¬ 
tado es x. (En otras palabras, sea x un punto de S.) Este resultado puede o no 
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pertenecer al conjunto A. Si pertenece, se dice que el suceso A ha ocurrido. En el 
caso contrario, el suceso A no ha ocurrido, en cuyo caso x e A', lo que equivale 
a decir que ha ocurrido el suceso complementario A'. Un suceso A es imposible si 
A = 0, porque en este caso ningun resultado del experimento puede pertenecer 
a A. El suceso A es cierto si A = S, porque entonces todo resultado de la prueba 
pertenece a A. 

La funcion de probabilidad P asigna a cada suceso A una probabilidad P(A). 
[Del valor de P(A) y del modo de asignarlo no nos ocuparemos por el momento.] 
El numero P(A ) se llama la probabilidad de que un resultado de la prueba sea un 
elemento de A. Tambien decimos que P(A) es la probabilidad de que el suceso A 
ocurra al efectuar el experimento. 

Al suceso imposible 0 debe asignarse probabilidad cero porque P es una me- 
dida de aditividad finita. No obstante, existen sucesos con probabilidad cero y que 
no son imposibles. En otras palabras, algunos de los subconjuntos no vacios de S 
pueden tener asignada probabilidad cero. Al suceso cierto S se asigna probabili¬ 
dad 1 segun la correcta deftnicjon de probabilidad, pero pueden existir otros sub¬ 
conjuntos que tambien tienen asignada probabilidad 1. En el ejemplo 1 de la 
seccion 13.8 se citan conjuntos no vacios con probabilidad cero y subconjuntos 
propios de S que tienen probabilidad 1. 

Dos sucesos A y B son igualmente probables si P(A) = P(B). El suceso A es 
mas probable que el B si P(A) > P(B), y por lo menos tan probable como el B si 
P(A) ^ P(B). La tabla 13.1 nos muestra una lista de locuciones del lenguaje ha¬ 
bitual en las discusiones de la teoria de probabilidades. Las letras A y B represen- 
tan sucesos, y x el resultado de un experimento asociado al espacio muestral S. 
Cada fila de la columna de la izquierda es una afirmacion relativa a los sucesos 
A y B, y en la misma fila en la columna de la derecha se expresa la misma afir¬ 
macion en el lenguaje de la teoria'de conjuntos. 


Tabla 13.1 Proposiciones usadas en la Teoria de Probabilidades 
y su significado en la de conjuntos 


Proposiciones Significado en la teoria de conjuntos 


Por lo menos uno de los sucesos A o B ocurre 
Ambos sucesos A y B ocurren 
Ni A ni B ocurren 
A ocurre y B no 

Exactamente ocurre uno de los sucesos A o B 
No mas de uno de los sucesos A o B ocurre 
Si A ocurre, tambien B (A implica B) 

A y B se excluyen mutuamente 
Suceso A o suceso B 
Suceso A y suceso B 


xe A u B 
re A n B 
re / n B' 
x e A n B' 

X 6 (A n B') u (A' n B) 
xe (A n B)’ 

A <= B 
A n B = 0 
AvB 
A n B 
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13.7 Ejercicios 


Sean S un espacio muestral dado y A, B, C sucesos cualesquiera (esto es, subconjuntos 
de S en la correspondiente algebra de Boole 3fi). Cada una de las afirmaciones de los ejer¬ 
cicios del 1 al 12 se expresa con una proposition. Expresar dichas afirmaciones como reunio- 
nes e intersecciones de A, B y C y de sus complementos. 


1 . 

2 . 

3. 

4. 

5. 

6 . 


Si ocurre A, no ocurre B. 7. 

Ninguno de los sucesos A, B, C ocurre. 8. 
Tan solo ocurre A. 9. 

Por lo menos uno de los A, B, C ocurre. 10. 
Uno exactamente de los A, B, C ocurre. 11. 
No ocurre mas que uno. 12. 


Por lo menos dos de los A, B, C ocurren. 
Ocurren exactamente dos. 

Ocurren no mas de dos. 

Ocurren A y C, pero no B. 

Ocurren los tres sucesos. 

Ocurren no mas de tres. 


13. A designa el suceso de conseguir un total impar al lanzar dos dados, y B el suceso de 
sacar por lo menos un 6. Expresar por una frase cada uno de los sucesos siguientes: 


a) A u B, 

b) A r* B, 

c) A n B', 


d) A' n B, 

e) A' n B', 

f) A' u B. 


14. Sean A y B dos sucesos. Demostrar que 

P(A n B) < P(A) < P(A u B) < P(A) + P(B). 

15. A y B representan dos sucesos y sean a = P(A), b = P(B), c = P(A n B).Calcular en 
funcion de a, b, y c, las probabilidades de los sucesos siguientes: 

a) A', d )A’vB', 

b ) B , e) A' u B, 

c) A u B, 0 A n B'. 

16. Dados tres sucesos A, B, C. Demostrar que 

P(A u B v C) = P(A) + P(B) + P(C) - P(A n B) — P(A n C) - P(B n C) + P(A n B n C) 


13.8 Ejemplos resueltos 

A continuacion veremos como pueden usarse los conceptos de las secciones 
precedentes, para resolver problemas tlpicos de probabilidades. 

ejemplo 1 . i,Cual es la probabilidad de que por lo menos una cara saiga en 
dos tiradas de una moneda? 
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Primera solucion. El experimento consiste en lanzar una moneda dos veces; 
el conjunto S de todos los resultados posibles puede expresarse como sigue: 

S = {hh, ht, th, tt}. 

Si aceptamos que esos resultados son igualmente probables, asignamos la probabi¬ 
lidad puntual P(x) = j a cada x de S. El suceso «que se presente por lo menos 
una cara» puede representarse por el subconjunto 

A = {hh, ht,th}. 

La probabilidad de este suceso es la suma de las probabilidades puntuales de sus 
elementos. Luego, P{A) = £ + i + i = f. 

Segunda solucion. Supongamos que se usa el mismo espacio muestral pero 
que asignamos las probabilidades puntuales como sigue: (*) 


P(hh) = 1, P(ht) = P{th) = P{n) = 0. 

Entonces la probabilidad del suceso «por lo menos sale una cara» es 

P{hh) + Piht) + Pith) = 1 + 0 + 0 = 1. 

El hecho de que lleguemos a un resultado final distinto del conseguido en la pri¬ 
mera solucion no debe alarmar al lector. Partimos de un conjunto de premisas 
distinto. Consideraciones de tipo psicologico pueden llevarnos a pensar que la 
asignacion de probabilidades en la primera solucion es la mas natural. No obstante, 
muchos podrian estar de acuerdo en que esto es asi si la moneda es «imparcial». 
Sin embargo, si la moneda esta «cargada» de manera que siempre saiga cara, la 
asignacion hecha en la segunda solucion es mas natural. 

El ejemplo anterior nos demuestra que no cabe esperar respuesta unica a la 
pregunta formulada en el mismo. Para contestar en forma adecuada tenemos que 
especificar la election del espacio muestral y la asignacion de las probabilidades 
puntuales. La probabilidad de un suceso puede deducirse de manera logica unica- 
mente cuando se conocen el espacio muestral y la asignacion de las probabilidades 
puntuales. Eligiendo de distintos modos el espacio muestral y las probabilidades 
puntuales puede llegarse a contestaciones «correctas» diferentes de la misma 
cuestion. 

A veces, la asignacion de probabilidades a los resultados particulares de un 

(*) Notese que para esta asignacion de probabilidades hay subconjuntos de S no vactos 
con probabilidad cero y subconjuntos propios con probabilidad 1. 
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experimento viene dictada por el lenguaje utilizado al describirlo. Por ejemplo, 
cuando un objeto es elegido «al azar» en un conjunto finito de n elementos, se 
entiende que cada resultado es igualmente probable y podrfa asignarsele probabili- 
dad 1 /n. Analogamente, cuando lanzamos una moneda o un dado, si no tenemos 
a priori motivo alguno para pensar que la moneda o el dado no son perfectos, 
suponemos que todos los resultados son igualmente probables. Este convenio se 
adoptara en todos los ejercicios de este capitulo. 

ejemplo 2. Si un naipe es sacado al azar de cada una de dos barajas, £cual 
es la probabilidad de que por lo menos uno sea el as de corazones? 

Solution. El experimento consiste en tomar dos naipes, a y b, uno de cada 
baraja. Representaremos un resultado por un par ordenado (a, b). El numero de 
resultados posibles, esto es, el numero total de pares distintos ( a , b) del espacio 
muestral S es 52 2 . Asignamos a cada uno de esos pares la probabilidad 1/52 2 . 
El suceso en el que estamos interesados es el conjunto A de pares (a, b), en los 
que o a o b es el as de corazones. En A hay 52 + 51 elementos. Por tanto, en 
estas hipotesis deducimos que 


P(A) = 


52 + 51 
52 2 


J_ _ _1_ 

26 52 2 ' 


ejemplo 3. Si dos naipes se sacan al azar de una baraja, <+ual es la proba¬ 
bilidad de que una de ellas sea un as de corazones? 


Solution. Como en el ejemplo 2 empleamos pares ordenados ( a , b) como 
elementos del espacio muestral. En este caso el citado espacio tiene 52-51 elemen¬ 
tos y el suceso A que se considera tiene 51+51 elementos. Si asignamos la pro¬ 
babilidad puntual 1/(52-51) a cada resultado obtenemos 


P(A) = 


2 - 51 
52 • 51 


26' 


ejemplo 4. iCual es la probabilidad de sacar 6 o menos de 6 con tres 
dados. 


Solution. Designamos cada resultado del experimento como una terna 
(a, b, c) donde a, b y c pueden tomar valores de 1 a 6. Por lo tanto, el espacio 
muestral consta de 6 3 elementos y asignamos la probabilidad 1/6 3 a cada resultado. 
El suceso A en cuestion es el conjunto de todas las ternas que satisfacen la des- 
igualdad 3 ^ a + b + c < 6. Si A n representa los conjuntos (a, b, c) para los 
cuales a + b + c = n, tenemos 

A = A 3 U At u A 5 u A e . 
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La enumeration directa muestra que los conjuntos A n , con n = 3, 4, 5 y 6 con- 
tienen 1, 3, 6 y 10 elementos respectivamente. Por ejemplo, el conjunto A 6 viene 
dado por 

A 6 = {(1,2, 3), (1,3, 2), (1, 1,4), (1,4, 1), (2, 1, 3), 


(2,3, 1), (2, 2, 2), (3, 1,2), (3,2, 1), (4, 1, 1)}. 


Por tanto, A tiene 20 elementos y 


P(A) = 


20 

6 2 3 


_5 

54' 


ejemplo 5. Se lanza un dado una vez. qCual es la probabilidad de que el 
numero de puntos conseguido sea par o multiplo de 3? 


Solucion. Elegimos el espacio muestral S = {1, 2, 3, 4, 5, 6}, que consta 
de seis elementos, a cada uno de los cuales asignamos la probabilidad %. El suceso 
«par» es el conjunto A — {2, 4, 6}, el suceso «multiplo de 3» es B — {3, 6}. Nos 
interesa su reunion, que es el conjunto A u B = {2, 3, 4, 6}. Puesto que este 
conjunto posee cuatro elementos tenemos P{A u B) = %. 

Este ejemplo puede resolverse de otro modo, usando la formula 


P{A U«) = P(A) + P(B) -P( A nB) = | + | - i. 


13.9 Ejercicios 

1. Sea S un espacio muestral finito de n elementos. Supongamos que asignamos la misma 
probabilidad a cada uno de los puntos de S. Sea A un subconjunto de S que conste 
de k .elementos. Demostrar que P(A) — k/n. 

En cada uno de los ejercicios 2 al 8, describir la election del espacio muestral y la asig- 
nacion de probabilidades. En los ejercicios relacionados con juegos de naipes, se supone 
que todos los naipes tienen la misma probabilidad de ser repartidos. 

2. Se mezclan cinco monedas falsas con nueve autenticas. 

a) Se selecciona al azar una moneda. Calcular la probabilidad de que sea falsa. 
Si se seleccionan dos monedas, calcular la probabilidad de que: 

b) una sea buena y una falsa. 

c) las dos sean falsas. 

d) las dps sean buenas. 

3. Calcular la probabilidad de cada uno de los sucesos que se describieron en el ejercicio 13 
de la seccion 13.7. Asignar la misma probabilidad a cada uno de los 36 elementos del 
espacio muestral. 
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4. iCual es la probabilidad de sacar por lo menos uno de los resultados 7, 11, o 12 con 
dos dados? 

5. Una mano de poker contiene cuatro corazones y una espada. La espada se rechaza y 
se toma un naipe de los restantes de la baraja. Calcular la probabilidad de sacar un 
quinto corazon. 

6. En el poker, una escalera son cinco cartas consecutivas no necesariamente del mismo 
palo. Si una mano contiene cuatro cartas consecutivas (pero no A234 o JQKA) y una 
quinta carta no consecutiva a las otras, calcular la probabilidad de lograr la escalera, al 
devolver la quinta carta y pedir una nueva. 

7. Una mano de poker contiene cuatro de las cinco cartas en sucesion pero con un «salto» 
intercalado (por ejemplo, 5689), la quinta carta se devuelve y se toma otra nueva del 
resto de la baraja. Calcular la probabilidad de conseguir llenar el «hueco intermedio*. 

8. Una urna contiene A bolas blancas y B bolas negras. Una segunda urna contiene C bolas 
blancas y D bolas negras. Se saca al azar un bola de la primera urna y se echa en la 
segunda urna. Seguidamente se extrae al azar una bola de la segunda urna. Calcular 
la probabilidad de cada uno de los sucesos siguientes: 

a) La primera bola es blanca. 

b) La primera bola es negra. 

c) La segunda bola es blanca, habiendo sido blanca la bola transferida. 

d) La segunda bola es blanca, habiendo sido negra la bola transferida. 

9. Se extraen dos bolas de una urna devolviendo la bola despues de la primera extraccion. 
La urna contiene cuatro bolas rojas y dos blancas. Calcular la probabilidad de cada 
uno de los sucesos siguientes. 

a) Ambas bolas son blancas. 

b) Ambas bolas son rojas. 

c) Ambas bolas son del mismo color. 

d) Por lo menos una bola es roja. 

10. Sea P„ la probabilidad de que ocurran exactamente n sucesos de los A y B, tomando n 
los valores 0, 1, 2. Expresar cada uno de los numeros P 0 , Pi, P 2 en funcion de P(A), 
P(B) y P(A n B). 

Puntos a favor. Algunos juegos de azar se expresan en funcion de la «suerte a favor® 
o «puntos a favor* mejor que en funcion de las probabilidades. Por ejemplo, si lanzamos 
un dado, la probabilidad de sacar un tres es 1/6. Los resultados posibles son seis, uno de 
ellos es favorable y cinco desfavorables. Esto a menudo se expresa diciendo que la suerte 
a favor del suceso esta como 1 a 5, o que la suerte en contra es de 5 a 1. Entonces suele 
relacionarse esta con la probabilidad mediante la igualdad 

1 1 
6 = 1 + 5' 

En general, si A es un suceso con probabilidad P(A) y si a y b son dos numeros reales 
que 

(13.6) P(A) = T~Z. 

a + b 

decimos que la suerte a favor de A es de a a b, o que la suerte en contra de A es de 6 a a. 
Puesto que 1 — a/(a + b) = b/(a + b), la suerte en contra de A es la misma que la suerte 
a favor del suceso complementario A'. El ejercicio siguiente esta dedicado a otras propie- 
dades de este concepto de «los puntos o casos favorables* y sus relaciones con las proba¬ 
bilidades. 
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11. Si P(A) = 1, probar que (13.6) solo puede satisfacerse si b = 0 y a ^ 0. Si P(A) ^ 1, 
demostrar que existen infinidad de elecciones posibles de a y b que satisfacen (13.6) 
pero que todas tienen la misma razor) a/b. 

12. Calcular los puntos a favor de cada uno de los sucesos descritos en el ejercicio 2. 

13. Dados los sucesos A y B. Si la suerte en contra de A es de 2 a 1 y a favor de A u B 
de 3 a 1, demostrar que 


A < P(B) <. J . 

Dar un ejemplo en el que P(B) = & y otro en el que P(B) = J. 


13.10 Algunos principios basicos de analisis combinatoric* 

Muchos problemas del calculo de probabilidades y de otras ramas de la Mate- 
matica pueden reducirse a problemas de recuento del numero de elementos de un 
conjunto finito. Los metodos sistematicos para estudiar tales problemas forman 
parte de una disciplina matematica conocida con el nombre de analisis combina- 
torio. En esta seccion nos referimos brevemente a algunas ideas fundamentales de 
analisis combinatorio que son utiles al analizar algunos de los mas complicados 
problemas de la teorfa de la probabilidad. 

Si tenemos a la vista todos lcs elementos de un conjunto finito, no resulta 
diffcil contar el numero de los mismos. Sin embargo, muy a menudo, un conjunto 
se describe de tal manera que es imposible «ver» todos sus elementos. Por ejem¬ 
plo, deseamos conocer el numero de manos de bridge distintas que se pueden 
repartir. Cada jugador recibe 13 naipes de los 52 de la baraja. El numero posible 
de manos distintas es el mismo que el de subconjuntos distintos de 13 elementos 
distintos que se pueden formar con un conjunto de 52 elementos tambien distin¬ 
tos. Ya que este numero supera los 635 mil millones, la enumeration directa de 
todas las posibilidades no es el mejor metodo de atacar el problema; no obstante, 
con el Analisis combinatorio puede resol verse sin dificultad. 

Este problema es un caso particular del problema mas general de calcular el 
numero de subconjuntos distintos de k elementos que pueden formarse con un 
conjunto de n elementos (*), siendo n > k. Designemos este numero por jin, k). 
Ya es conocido que 

(13.7) An, k) = (J) , 

donde, como de costumbre, (£) representa el coeficiente binomico, 

( n ) = _— - 

W kl(n — k)\ 

(*) Cuando decimos que un conjunto tiene n elementos, significamos que consta de n 
elementos distintos. 
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En el problema de las manos de bridge tenemos /(52, 13) = (”) =635 013 559 600 
manos distintas que un jugador puede recibir. 

Existen muchos metodos conocidos para llegar a (13.7). El mas directo con- 
siste en formar cada subconjunto de k elementos eligiendo estos uno a uno. Exis¬ 
ten n posibilidades en la primera election, n — 1 en la segunda, y n — (k — 1) en 
la A:-esima. Si efectuamos todas las elecciones posibles de esta manera, obtenemos 
un total de 


n(n — 1) • • • (n — k + 1) = ;- 

(n - k)l 

subconjuntos de k elementos. Naturalmente, no todos esos conjuntos son distintos. 
Por ejemplo, si k = 3 los seis subconjuntos. 

{by b , c}, {b , c, n}, {c, a, b }, {a, c 9 b\, {c, b , a} 9 { b 9 a , c} 

son todos iguales. En general, con este metodo, cada subconjunto de k elementos 
se cuenta exactamente k\ veces.(*). Por consiguiente, debemos dividir el numero 
n\/(n — k) por k\ para obtener f(n,k). Esto nos da f(n,k)= (£), como se 
afirmo. 

Este razonamiento es mas o menos caracteristico del Analisis combinatorio 
que se precisa en las proximas secciones. Por consiguiente, parece natural comen- 
tar brevemente los principios fundamentales en los que se apoya este Analisis. 

A menudo nos interesa contar el numero de elementos del producto carte- 
siano de n conjuntos finitos A ± ,..., A„. El producto cartesiano se representa 
con el simbolo Ai X ... X A n y se define asi: 

A x x • • • x A n = {(<*!,..., a n ) | a x e A x ,... , a n e AJ. 

Esto es, el producto cartesiano consta del conjunto de todas las n-plas ordenadas 
(«i,..., ft,) en las que el fc-esimo elemento de cada n-pla procede del it-esimo 
conjunto Ak. 

En la figura 13.1 se muestra un ejemplo con n = 2. En el A x = {1, 2, 4, 5} 
y A 2 = {1, 3}. Existen 4 elementos en A x y 2 en A 2 , dando un total de 8 elemen¬ 
tos en el producto cartesiano A x X A 2 . Con mayor generalidad, si A x consta de k x 
elementos y A 2 de k 2 elementos, entonces A x X A 2 constara de k x k 2 elementos. 
Por induccion respecto a n, se deduce que si A, consta de k r elementos, el pro¬ 
ducto cartesiano A x X ... X A„ constara de k x ... k„ elementos. 

Para expresar este resultado en la terminologia de las funciones de conjunto, 
sea 2F la clase de todos los conjuntos finitos y v la funcion de conjunto definida 

(*) En el ejemplo 3 en la pagina 590, se ve con claridad la explicacidn de esto, y 
damos una deduccion de (13.7) mas rigurosa. 
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sobrei^ asi: Si Ae ■¥, v{A) representa el numero de elementos distintos de A. 
(Para el conjunto vacio definimos v(0) = 0.) Es entonces facil comprobar que v 
es una funcion de conjunto de aditividad finita, podemos pues escribir, 

(i3.8) ,(y Sf ) = IHS,) 

si {Si, S 2 ,,S n } es una coleccion de conjuntos finitos disjuntos (esto es, si 
S ( n Sj = 0 siempre que i ¥= j ). El numero de elementos de un producto carte- 
siano puede expresarse en funcion de v como sigue: 


v(A l x A 2 x X A n ) = • ’ ' HAJ. 


at 


3- 

A t = {1,3} 2- 

1- 




k 


r 1 

,_ 4 



r 1 



. 

i 

A, 

2 3 4 5 

= {1,2, 4, 5} 


Figura 13.1 Producto cartesiano de dos conjuntos. Los puntos marcados representan 

Ai X A 2 . 


Una formula parecida nos dice como contar el numero de elementos de cualquier 
conjunto T de n-plas si conocemos el numero de elecciones posibles para cada una 
de las sucesivas componentes. Por ejemplo, supongamos que existen k 1 elecciones 
posibles para el primer componente x±. Sea k, el numero de elecciones posibles 
para x 2 , una vez x x es conocido. Analogamente, k r sea el numero de elecciones po¬ 
sibles para x r , una vez x X) x 2 ,..., x r -i han sido elegidos. El numero de n-plas 
que pueden formarse con estas elecciones es: 


v(T) = k x k 2 ■ ■ ■ k n . 
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Esta formula se denomina frecuentemente regia del calculo secuencial. Puede de- 
mostrarse por induccion. En muchas aplicaciones el conjunto de elecciones para x r 
puede ser diffcil de precisar, pues no puede determinarse hasta despues de haber 
elegido los componentes anteriores. (Este es el caso del calculo de las manos de 
bridge.) Afortunadamente, al aplicar la regia del calculo secuencial no necesita- 
mos conocer ese conjunto de elecciones de x r , sino unicamente el numero de elec¬ 
ciones posibles para x r . 

La propiedad aditiva expresada por la formula (13.8) y la regia del calculo 
secuencial nos proporcionan la solucion de muchos problemas de calculo. En los 
ejemplos siguientes vamos a ver el modo de aplicarlos. 

ejemplo 1. Muestreo con reposicion. Sea un conjunto S que conste de n 
elementos. Si fc> 1, qcuantas k- plas pueden formarse si-cada componente puede 
ser un elemento cualquiera de S? 

Observation. Puede ser util imaginar S como una urna que contenga n bolas nu- 
meradas 1,2. n. Sacamos una bola y tomamos su marca como primer compo¬ 

nente de nuestra fc-pla. Devolvemos la bola a la urna, volvemos a sacar otra bola 
y tomamos su marca como segunda componente y ast sucesivamente, hasta que 
hemos completado fc extracciones. De este modo, la misma marca puede aparecer 
varias veces en la fc-pla formada. 


Solucion. Cada fc-pla es un elemento del producto cartesiano 

T = S 1 X • • • X S k , 

siendo cada S; = S. Recfprocamente, cada elemento de T es una de las fc-plas que 
consideramos. Luego el numero de las fc-plas formadas de este modo es 

v{T) = v(S,) ■ ■ ■ v(S k ) = «*. 

ejemplo 2. Muestreo sin reposicion. Dado un conjunto S de n elementos. 
Si fc ^ n, qcuantos fc-plas pueden formarse si los componentes se eligen en S sin 
reposicion, es decir, si ningun elemento de S puede usarse mas de una vez en una 
misma fc-pla? 

Solucion. Para el primer componente x t existen n elecciones posibles (los n 
elementos de S). Una vez elegido x lt quedan n — 1 elecciones posibles para x 2 . 
Elegido x 2 , que dan n — 2 posibilidades para x 3 , y ast sucesivamente, para Xk ten- 
dremos n — k -f 1 posibilidades de eleccion. Por lo tanto, segun la regia del 
calculo secuencial, el numero total de fc-plas ast formadas es: 

n{n - l)(n - 2) • • • (n - fc + 1) = -—. 

(n — fc): 
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En particular, cuando k — n resultan n\ n-plas distintas. 

ejemplo 3. Niimero de subconjuntos de k elementos de un conjunto dado 
de n elementos. Si k^n, ^cuantos subconjuntos distintos de k elementos pueden 
formarse a partir de un conjunto dado S de n elementos? 

Solucidn. Designemos por r el numero de subconjuntos en cuestion y estos 
por 


Ai, A 2 ,.. . , A r . 

Estos conjuntos son distintos, pero no necesariamente disjuntos. Calcularemos r en 
funcion de n y k por un metodo indirecto. A tal fin, designemos con B, la colec- 
cion de /c-plas que pueden formarse eligiendo los componentes entre los elementos 
de Ai sin reposicion. Los conjuntos B u B 2 ,..., B, son disjuntos. Ademas, si apli- 
camos el resultado del ejemplo 2 con n = k tenemos: 


Pongamos ahora 


v(B i ) — k ! para cada i = 1,2 ,,r. 
T = B x U U • • • U B r . 


Este conjunto T consta de todas las fc-plas que se pueden formar eligiendo los 
componentes en S sin reposicion. Del ejemplo 2. tenemos: 


v(T ) = «!/(« — k)\ 

y por la aditividad tenemos tambien. 


v(T) = 1 v(B i ) = k\r. 

i=l 

Igualando las dos expresiones de v(T) obtenemos: 

r = - Si - = ("Y 

k'.(n-k)'. W 

Esto demuestra la formula (13.7) establecida antes en esta seccion. 

Si utilizamos el resultado del ejemplo 3 para calcular el numero total de sub¬ 
conjuntos de un conjunto S que consta de n elementos, obtenemos: 



Ejercicios 


591 


Ya que esta suma tambien se obtiene al desarrollar (1 + l) n por la formula bino¬ 
mial, el numero de subconjuntos de S es 2\ 

13.11 Ejercicios 

1. Sea A = {1,2,3}. Desarrollar segun la notaci6n en lista el conjunto de pares ordenados 
(a, b) obtenidos eligiendo el primer componente en A y el segundo componente entre 
los restantes elementos de A. Tal conjunto de pares ordenados, ipuede expresarse en 
forma de producto cartesiano? 

2. Una pareja de naipes puede ser obtenida de una baraja de 52 naipes, de 52 -51 = 2652 
maneras. Determinar el numero de parejas distintas y exponer el razonamiento. 

3. Un comite del Senado norteamericano que consta de seis democratas y cuatro republi- 
canos debe elegir un presidente y un vicepresidente. <',De cuantas maneras se pueden 
elegir este par de funcionarios si el presidente debe ser democrata? 

4. Un juego consiste en tirar una moneda dos veces y lanzar luego un dado. Expresar 
cada resultado de este experimento como una terna ordenada (a, b, c), donde cada a y b 
pueden ser o C (cara) o + (cruz) y c es el numero de puntos que marca el dado, 
por ejemplo (C, C, 3) significa que ha salido cara en ambas tiradas y el dado ha mar- 
cado el 3. Expresar el conjunto de todos los resultados posibles como producto carte¬ 
siano y determinar el numero de resultados posibles. 

5. (,De cuantas maneras puede repartirse una baraja de bridge de 52 naipes en cuatro 
manos de 13 naipes? Exponer el lazonamiento. 

6. Se lanzan dos dados, uno rojo y uno bianco. Representar el resultado como un par 
ordenado (a, b), donde a representa el numero de puntos del dado rojo, y b los del 
bianco. iCual es el numero posible de pares ordenados (a , b)l iCuantos de esos cum- 
plen la condicidn de que la suma a + b es: 

a) <ipar? b) ^divisible por 3? c) ipar o divisible por 3? 

7. Una mano de poker contiene cinco naipes repartidos de una baraja de 52. ^Cuantas 

manos distintas pueden repartirse que contengan: 

a) £dos parejas (por ejemplo, 2 reyes, 2 ases y un 3)? 

b) £un flux (cinco cartas de un mismo palo)? 

c) iuna escalera de un mismo palo (cinco cartas consecutivas de un mismo palo, no 
incluyendo el «10», la sota, la reina, el rey y el as)? 

d) iuna escalera real («10», sota, reina, rey, as de un mismo palo)? 

8. En relacion con el ejercicio 7. Calcular la probabilidad para que una mano de poker sea: 

a) un flux. 

b) una escalera de un mismo palo. 

c) una escalera real. 

9. iCuantos comites de 50 senadores norteamericanos pueden formarse que contengan: 

a) iun solo senador de Alaska? 

b) idos senadores de Alaska? 

10. Un comite de 50 senadores se elige al azar. Calcular la probabilidad de que queden 
incluidos los dos senadores por Alaska. 

11. Se forman grupos de cuatro si'mbolos puestos en lfnea. Cada si'mbolo puede ser punto 
o raya. iCuantos grupos pueden formarse? 

12. iCuantas palabras de k letras pueden formarse con un alfabeto que contiene n letras? 

13. Demostrar que: 


a) 



+ • • • = 2 n_1 . 
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14. Supongamos que un conjunto de pares ordenados (a, b) se ha construido eligiendo el 
primer componente en un conjunto de k elementos, por ejemplo, del conjunto 

j«i.«i.}, y el segundo componente en un conjunto de m elementos {b \,... ,b„[. 

Existen m pares con el primer componente at, esto es, (a\, b \),..., (ai, b m ). Del mismo 
modo, hay m pares (a,, bp, ..., (a,, b m ) con el primer componente Por lo tanto, el 
numero total de pares ordenados (a, b) es m + m + ... +m (k sumandos). Esta suma 
vale km, que prueba la regia del calculo secuencial para conjuntos de pares ordenados. 
Por induccion demostrar la regia para conjuntos de n-plas ordenadas. 


13.12 Probabilidades condicionadas 

Se lanza un dado correcto y se sabe que el resultado es un numero par. 
qCual es la probabilidad de que este numero sea divisible por 3? qCual es la 
probabilidad de que una criatura padezca daltonismo, en el supuesto de que es 
un nino? Estas preguntas pueden formularse en la siguiente forma: Sean A y B 
sucesos de un espacio muestral S. Si ocurre B, qcual es la probabilidad de que 
ocurra A ? Esto no es lo mismo que preguntar cual es la probabilidad del suceso 
A n B. En realidad cuando A = B la pregunta es: Si A ocurre, i,cual es la proba¬ 
bilidad de que A ocurra? La contestacion seria en este caso 1, y esta puede ser o 
no la probabilidad del suceso A n B. Para tratar tales problemas en general, 
volvamos al caso del dado. 

Cuando nos ocupamos de cuestiones de probabilidad relativas al lanzamiento 
de un dado, utilizamos ordinariamente como espacio muestral S = { 1, 2, 3, 4, 5, 6} 
y asignamos la probabilidad Vo a cada elemento de S. El suceso «divisible por 3» 
es el subconjunto A = {3, 6} y el suceso «par» es el subconjunto B — { 2, 4, 6}. 
Deseamos conccer la probabilidad de que un elemento este en A, sabiendo ya que 
esta en B. Ya que estamos interesados en resultados en los que el numero es par, 
prescindimos de los resultados 1, 3, 5 y utilizamos, en lugar de S, el conjunto 
B = { 2, 4, 6} como espacio muestral. El suceso que nos interesa es tan solo el 
conjunto de un elemento {6}, que es el unico resultado del nuevo espacio muestral 
divisible por 3. Si todos los resultados de B se consideran igualmente probables, 
hay que asignar a cada uno de ellos la probabilidad %, luego la probabilidad de 
{6} es tambien y 3 . 

Observese que se ha resuelto el problema anterior empleando una idea muy 
elemental. Simplemente hemos cambiado el espacio muestral S por el B y se ha 
procedido a nueva asignacion de probabilidades. Esto nos sugiere la manera de 
generalizar el procedimiento. 

Sea (S, Sti, P) un espacio de probabilidad dado. Sean A y B dos sucesos y 
planteemonos la siguiente cuestion: «Si B acontece, qcual es la probabilidad de 
que ocurra A?» Como en el anterior ejemplo, podemos cambiar el espacio mues- 
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tral S por el B y asignar nuevas probabilidades. Para el mismo B asignamos la 
probabilidad 1. Puesto que nos interesan los elementos de A que pertenecen al 
nuevo espacio muestral B, nuestro problema es calcular la probabilidad del suceso 
A n B segun las nuevas probabilidades asignadas. Esto es, si F representa la fun- 
cion de probabilidad asociada al nuevo espacio muestral B, tenemos que calcular 
P\A n B). 

Demostraremos ahora que si P(B) ¥= 0 siempre podemos definir una funcion 
de probabilidad F y un algebra booleana S3' de subconjuntos de B de modo que 
(. B, S3' ,P') sea un espacio de probabilidad. Como algebra S3' tomamos la colec- 
cion de todos los conjuntos T n B donde T es un conjunto que pertenece al alge¬ 
bra booleana original S3. Es facil comprobar que la S3', asi definida, es realmente 
un algebra booleana. Una manera de definir una funcion de probabilidad F so- 
bre S3' consiste en dividir cada una de las antiguas probabilidades por P(B). Esto 
es, si C e S3' ponemos 


P\C) 


P(C) 
P(B) 


(Esto en la hipotesis de que P(B) ¥= 0.) Lo que hemos hecho solo ha sido modifi- 
car la escala, con todas las probabilidades multiplicadas por el factor 1/P(B). Es 
facil comprobar que esta definicion de P' nos da una medida de probabilidad. 
Es evidentemente no negativa y asigna la probabilidad 1 a B. La propiedad aditiva 
resulta inmediatamente de la de P. 

Puesto que cada C de S3' es de la forma A n B, donde A es un suceso en 
el espacio muestral original S, podemos dar a la definicion de P' esta otra forma: 


P'(A n B) = 


P(A O B) 
P(B) 


Esta discusion sugiere que el cociente P(A n B)fP(B) nos proporciona una justa 
medida de la probabilidad de que ocurra A, en el supuesto de que B haya ocurrido. 
La definicion que sigue esta hecha con esta intention: 


definicion de probabilidad condicionada. Sea ( S, S3, P) un espacio de 
probabilidad y B un elemento tal que P(B) # 0. La probabilidad condicionada de 
que un suceso A ocurra, en el supuesto de que B ha ocurrido, se representa me- 
diante el simbolo P(A\B) {lease: «la probabilidad de A, dado B») y se define por 
la igualdad 


P(A | B) = 


P(A n B) 
P(B) 


La probabilidad condicionada P{A\B) no esta definida si P(B) = 0. 
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Los ejemplos que siguen ilustran el uso del concepto de probabilidad condi- 
cionada. 

ejemplo 1. Consideremos una vez mas el problema antes mencionado: Se 
lanza un dado y se sabe que el resultado es un numero par. iCual es la probabili¬ 
dad de que ese numero sea divisible por 3? Podemos tomar por espacio muestral 
S = {l,2,3,4,5,6}y asignar la probabilidad £ a cada elemento de S. El suceso 
«par» es el conjunto B = {2, 4, 6} y el suceso «divisible por 3» es el conjunto 
A = {3, 6}. Por consiguiente: 


P(A | B) = 


P(A O B) 

P(B) 


1/6 = 1 

3/6 “ 3 ' 


Esto esta de acuerdo con la anterior solution en la que se tomo B como espacio 
muestral y se asigno la probabilidad Vs a cada elemento de B. 

ejemplo 2. Se trata de un ejemplo tfpico usado en el Departamento de 
Biologia de Caltech para prevenir contra los errores de las estadisticas superficiales. 
Para «demostrar» estadisticamente que la poblacion de los Estados Unidos con- 
tiene mas ninos que ninas se pide a cada estudiante que cite el numero de ninos 
y ninas de su familia. Invariablemente, el numero total de ninos excede al de ninas. 
Las estadisticas en este caso son parciales ya que todos los estudiantes de bachi- 
llerato en Caltech son varones. Por lo tanto, la cuestion que aqui se considera no 
es precisamente la probabilidad de que una criatura sea nino, sino mas bien la 
probabilidad de que una criatura sea nino en el supuesto que procede de una 
familia que por lo menos tiene un nino. 

Para calcular las probabilidades en un ejemplo de este tipo consideremos una 
muestra de 4 n familias, cada una con dos hijos. Supongamos que n familias tie- 
nen 2 ninos, 2 n familias un nino y una nina, y n familias 2 ninas. El espacio 
muestral S es el conjunto de las 8 n criaturas de esas familias y asignemos la pro¬ 
babilidad P(x) = l/(8n) a cada x de S. Designemos por A el suceso «la criatura 
es nino» y por B «la criatura procede de una familia con un nino por lo menos», 
La probabilidad P(A) es 1/2. Analogamente P(B) — 3/4 ya que 3 n de las 4n fami¬ 
lias tienen por lo menos un nino. Por lo tanto la probabilidad de que una criatura 
sea nino, dado que procede de una familia con un nino por lo menos, es la proba¬ 
bilidad condicionada 


P{A \ B) = P ^^B ) = m= lJ2 = 2 
1 P(B ) P(B) 3/4 3 
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13.15 Independencia 

Un concepto importante relacionado con el de probabilidad condicionada, es 
el de independencia de sucesos, que puede definirse como sigue: 

definicion de independencia. Dos sucesos A y B se llaman independientes 
(o estocasticamente independientes) si, y sdlo si, 

(13.9) P(A n B) = P(A)P(B). 

Si A y B son independientes, P(A\B) = P(A) si P(B) =A 0. Esto es, la proba¬ 
bilidad condicionada de A, dado B, es la misma que la probabilidad «absoluta» 
de A. Esta relacion pone de manifiesto el significado de la independencia. El cono- 
cimiento de que B ha ocurrido, no influye en la probabilidad de que A ocurra. 

ejemplo 1. Una carta es extraida de una baraja de 52. Cada carta tiene la 
misma probabilidad de ser seleccionada. Demostrar que los dos sucesos «sacar un 
as» y «sacar un corazon» son independientes. 

Solucidn. Elegimos un espacio muestral S de 52 elementos y asignamos la pro¬ 
babilidad 5 ± a cada elemento. El suceso A, «sacar un as» tiene la probabilidad 
P(A) = 5 \ = j— 3 . El suceso B, «sacar un corazon» tiene la probabilidad P(B) = 
\\ = El suceso A n B significa «sacar el as de corazones», que tiene la pro¬ 
babilidad , satisface la igualdad (13.9) y los sucesos A y B son independientes. 

ejemplo 2. Se lanzan independientemente tres dados «correctos», de modo 
que cada combination sea igualmente probable. Sea A el suceso consistente en que 
la suma de los digitos obtenidos sea seis y B el que los tres digitos sean distintos. 
Determinar si estos dos sucesos son independientes o no. 

Solucidn. Como espacio muestral S tomamos el conjunto de todas las ternas 
(a, b, c ) pudiendo a, b y c tomar los valores 1, 2, 3, 4, 5, 6. En S existen 6 3 ele¬ 
mentos, y puesto que son igualmente probables asignamos la probabilidad 1/6 3 a 
cada uno. El suceso A es el conjunto de todas las ternas (a, b, c) tales que 
a + b + c = 6. Por enumeration directa vemos que hay 10 ternas de esta indole, 
a saber: 


(1,2, 3), (1,3,2), (1,1,4), (1,4, 1), 
(2,1,3), (2,3,1), (2,2,2), 

(3, 1,2), (3,2, 1), 

(4, 1, 1). 
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El suceso B consta de todas las ternas ( a, b, c) para las que a ¥= b, b¥= c, y 
a c. Existen 6 • 5 ■ 4 = 120 elementos en B. Exactamente seis de esos elementos 
pertenecen a A, de manera que A O B tiene seis elementos. Por lo tanto, 

P(AnB) = P04) = ^, y = 

En este caso P{A nS) # P(A)P(B); luego los sucesos A y B no son indepen- 
dientes. 

Para mas de dos elementos se define la independencia del modo siguiente. 
Una coleccion finita ,s/ de n sucesos se dice que es independiente si los sucesos 
satisfacen la propiedad multiplicativa 

( m \ m 

ru* = TT p(A k ) 

k= 1 / k =1 

para toda subcoleccion finita {A,, A 2 ,, A m }, donde m puede tomar los valores 
m = 2, 3 ,..., n, y los conjuntos At pertenecen a ■ 

Cuando -s? consta exactamente de tres sucesos A, B y C, la condicion de inde¬ 
pendencia (13.10) exige que 

(13.11) P(A r\B) = P(A)P(B), P(A nC) = P(A)P(C), P(B P> C) = P(B)P(C), 

y 

(13.12) ^n«nc) = P(A)P(B)P(C). 

Puede pensarse que las tres igualdades (13.11) son suficientes para que se 
satisfaga (13.12) o, en otras palabras, que la independencia de tres sucesos es una 
consecuencia de la independencia a pares. Esto no es cierto, como puede verse con 
el siguiente ejemplo: 

Cuatro tickets con las marcas a, b, c y jibe, se colocan en una caja. Se extrae 
un ticket al azar, y el espacio muestral es: 

S = {a, b, c, abc}. 

Los sucesos A, B y C se definen como sigue: 

A = {a, abc}, B = {b, abc }, C = {c, abc}. 

Esto significa, que el suceso X consiste en la extraccion de un ticket que contiene 
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la letra x. Es facil comprobar que cada una de las tres igualdades (13.11) se satis- 
face de manera que los sucesos A, B, y C son independientes a pares. Sin embargo, 

(13.12) no se satisface y por consiguiente los tres sucesos no son independientes. 
Los calculos son sencillos y los dejamos como ejercicio para el lector. 

13.14 Ejercicios 

1. Sean A y B dos sucesos con P(A) ^ 0, P(B) # 0. Demostrar que 

(13.13) P(A nB)= P{B)P(A | B) = P(A)P(B \ A). 

Algunas veces es mas facil calcular las probabilidades P(A) y P(B\A) directamente enu- 
merando los casos que calcular P(A n B). Cuando esto ocurre, la igualdad (13.13) nos da 
un metodo adecuado para calcular P(A r\ B ). En el proximo ejercicio damos un ejemplo. 

2. Una urna contiene siete bolas blancas y tres negras. Una segunda urna contiene cinco 
blancas y cinco negras. Se extrae al azar una bola de la primera urna y se coloca en 
la segunda. A continuacion se extrae al azar una bola de la segunda urna. Represen- 
temos con A el suceso «bola negra en la primera extraction* y con B el suceso 
«bola negra en la segunda extraction*. 

a) Calcular las probabilidades P(A) y P(B A) directamente por enumeration de los 
casos posibles. Utilizar la igualdad (13.13) para calcular P(A O B). 

b) Calcular directamente P(A O B) enumerando todos los pares de extracciones posibles. 

3. a) Sean A 1 .A 2 .A 3 tres sucesos tales que P{A t n A 2 ) 5 * 0. Demostrar que 

P(A 1 0 A 2 A 3 ) — P(A 1 )P(A 2 1 A 1 )P(A 3 I A j o A 3 ). 

b) Generalizar por induccion este resultado como sigue: Si Ai, A 2 , ■ ■ ■ ,A„ son n su¬ 
cesos (n > 2 ) tales que/’(Aj n A 2 • • • n A „„j)^ 0 , entonces, 

P(A r n A 2 n • - • n A n ) = P(A 1 )P(A 2 1 A 1 )P(A 3 \ A x n A 2 ) • ■ • P(A n | A t n A 2 n ■ ■ ■ n A„_j). 

4. Un comite de 50 senadores se elige al azar. Hallar la probabilidad de que los dos 
senadores por Alaska queden incluidos, dado que por lo menos uno ya lo esta. 

5. Una urna contiene cinco bolas doradas y siete azules. Se extraen al azar dos bolas (sin 
devolverlas a la urna). Si la primera bola es dorada, calcular la probabilidad de que 
la segunda sea tambien dorada. 

6 . Un baraja es repartida en cuatro manos de 13 naipes cada una. Si una mano tiene 
exactamente siete espadas, £cual es la probabilidad de que una determinada de las 
otras manos contenga a) por lo menos una espada, b) por lo menos dos espadas, c) un 
palo complete? 

7. Demostrar que P(A u B | C) — P(A \ C) + P(B \ C) — P(A C\ B\C). 

8. Sean Ai,A 2 ,...,A„ n sucesos disjuntos cuya reunion es el espacio muestral S comple¬ 
te. Para todo suceso E tenemos la igualdad 

n n 

E = E n S = E n U A { = (J (E n A t ). 

t'=l i-l 
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Esta igualdad establece que E puede- ocurrir tan sdlo en conjuncidn con algun A,. De- 
mostrar que 


a) PIE) = 2 P(E r\ A t ). 

i =1 

b) P(E)=^P(E\AdP(Ad. 

i=i 

Esta formula es util cuando las probabilidades condicionadas P(E\Ai) son mas sencillas 
de calcular que P(E). 

9. Una moneda «correcta» es lanzada repetidamente. Sale cara en los seis primeros lanza- 
mientos. iCual es la probabilidad de que saiga cara en el septimo? 

10. Dados los sucesos independientes A y B cuyas probabilidades no son 0 ni 1. Demostrar 
que A' y B' son independientes. iOcurre lo mismo si A o B tienen probabilidad 0 6 1? 

11. Dados los sucesos independientes A y B. Probar o rechazar, segun convenga en cada 
caso, que: 

a) A' y B son independientes. 

b) A u B y A n B son independientes. 

c) P(AUB)= 1- P(A')PIB'). 

12. Si Ai,A 2 , ■ ■ ■, A„ son sucesos independientes, demostrar que 

+ TT>«) = 1 - 

\>=1 / ! = 1 

13. Si tres sucesos A, B, y C son independientes, demostrar que A u B y C son indepen¬ 
dientes. [ Indicacidn , Utilizar el resultado del ejercicio 7 para demostrar que 
P(A u B | C) = P(A u 7?).] 

14. Sean A y B dos sucesos, ninguno de los cuales tiene probabilidad 0. Demostrar que son 
ciertas o que no lo son cada una de las afirmaciones siguientes: 

a) Si A y B son disjuntos, A y B son independientes. 

b) Si A y B son independientes, A y B son disjuntos. 

15. Se lanza un dado dos veces, el espacio muestral consta de 36 posibles pares de resulta- 
dos ( a, b) cada uno con probabilidad 3 * 5 . Sean A, B y C los sucesos siguientes: 

A = {(a, b) | a es impar}, B = {(a, b) \ bes impar}, C = {(a, b) \ a + be s impar}. 

a) Calcular P(A), P{B), P{C), P(A n B ), P(A n C),P(B n C), y P(A nB nC). 

b) Demostrar que A, B y C son independientes a pares. 

c) Demostrar que A, B y C no son independientes. 


13.15 Experimentos o pruebas compuestas 

Volvamos ahora al problema de de Mere mencionado en la introduccion —si 
es lo mismo apostar la misma cantidad a favor 0 en contra de la aparicion por lo 
menos de un «doble seis» en 24 tiradas de un par de dados. Tratemos el problema 
de un modo mas general: iCual es la probabilidad de conseguir un doble seis 
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por lo menos una vez en n tiradas de un par de dados? ^Esta probabilidad es ma¬ 
yor o menor que un medio cuando n — 24? 

Consideremos en primer lugar la prueba consistente en lanzar un par de 
dados una sola vez. El resultado de este juego puede representarse mediante pares 
ordenados (a, b) en los que a y b recorren los valores 1, 2, 3, 4, 5, 6. El espacio 
muestral S consta de 36 de esos pares. Puesto que los dados son correctos asig- 
namos a cada par de S la probabilidad %6- 

Supongamos que lanzamos los dados n veces. La sucesion de las n pruebas 
es una prueba compuesta que queremos describir matematicamente. Por ello nece- 
sitamos un nuevo espacio muestral y una correspondiente medida de probabilidad. 
Consideremos los resultados del nuevo juego como n-plas ordenadas (x t ,, x„), 
en donde cada componente x, es uno de los resultados del espacio muestral origi¬ 
nal S. Es decir, el espacio muestral para la prueba compuesta es el producto car- 
tesiano S X .. . X S, que se representa por S". El conjunto S" tiene 36" elemen¬ 
ts, y asignamos igual probabilidad a cada element: 

P( X ) = J- si x eS n . 

36" 

Nos interesa el suceso «por lo menos un doble seis en n tiradas.» Designe- 
moslo por A. En este caso es mas sencillo calcular la probabilidad del suceso 
complementario A', que significa «ningun doble seis en n tiradas.» Cada element 
de A’ es una n-pla, cada uno de cuyos componentes pueden ser cualquier element 
de S except (6, 6). Por consiguiente existen 35 valores posibles para cada com¬ 
ponente y por tanto (35) n n-plas en total en A'. Puesto que cada element de A' 
tiene probabilidad (A)", la suma de todas las probabilidades puntuales en A’ es 
(If)". Esto nos da 


/>(+) = 1 - P(A’) = 1 - (ft)”. 

Para contestar a la pregunta de de Mere tenemos que decidir si P(A) es mayor 
o menor que V 2 cuando n = 24. La desigualdad P(A) ^ V 2 cs equivalente a 
1 — (tf) n ^ V 2 , 0 (ft)" ^ y 2 - Tomando logaritmos encontramos 

n log 35 — n log 36 < —log 2, 0 n> --= 24.6+. 

log 36-log 35 

Por consiguiente P(A) < V 2 cuando n = 24 y P(A) > V 2 cuando n > 25. No es 
ventajosa una apuesta de una cantidad al suceso de que por lo menos se presente 
un doble seis en 24 tiradas, frente a la apuesta de la misma cantidad al suceso 
contrario. 

Esta discusion sugiere un metodo general para tratar los experimentos sucesi- 
vos. Si una prueba se repite dos o mas veces, el resultado puede considerarse 
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como una prueba compuesta. Mas general, una prueba compuesta puede ser el 
resultado de ejecutar dos o mas pruebas distintas sucesivamente. Cada una de las 
pruebas individuales puede estar relacionada con cada una de las otras o pueden 
ser estocasticamente independientes, en el sentido de que la probabilidad del re¬ 
sultado de cada una de ellas no depende de los resultados de las otras. 

Por simplicidad, discutiremos como se pueden combinar dos pruebas inde¬ 
pendientes en una prueba compuesta. La generalization a mas de dos experiencias 
sera evidente. 

Para asociar el espacio de probabilidad natural a una prueba o experiencia 
compuesta, debemos definir el nuevo espacio muestral S, la correspondiente alge¬ 
bra booleana dd de subconjuntos de S, y la medida de probabilidad P sobre dd. 
Como en el ejemplo anterior, usamos el concepto de producto cartesiano. 

Sean {S x , dd x , P x ) y {S 2 , &d„,P 2 ). dos espacios de probabilidad asociados a 
dos experiencias E x y £ 2 . Con E representamos la experiencia o prueba compuesta 
para las que el espacio muestral S es el producto cartesiano S x X S 2 . Un resultado 
de E es el par (x, y) de S, donde el primer componente x es un resultado de £1 
y el segundo y un resultado de £ 2 . Si Si tiene n elementos y S 2 m, el producto 
S x X S 2 tendra nm elementos. 

Como nueva algebra booleana 3d tomamos la coleccion de todos los subcon¬ 
juntos de S. A continuation definimos la funcion de probabilidad P. Ya que S es 
finito podemos definir P(x, y) para cada punto (x, y) de S y utilizar la aditividad 
al definir P para los subconjuntos de S. Las probabilidades £(x, y) pueden asig- 
narse de varias maneras. Sin embargo, si dos pruebas £1 y E 2 son estocastica¬ 
mente independientes, definimos P mediante la ecuacion 

(13.14) P(x,y) = P x (x)P 2 (y) para cada (x, y) de S. 

Se justifica esta definition del siguiente modo. Consideremos dos sucesos par- 
ticulares A y B del nuevo espacio S, 


y 


A = {(Xi, y x ), (X!, y 2 ),. .. y m )} 


B = {(x 1; y x ), (x 2 , y,), . . . , (x,,,^)}. 


Esto es, A es el conjunto de todos los pares de Si X S 2 cuyo primer elemento es 
x,, y B es el conjunto de todos los pares cuyo segundo elemento es y x . La inter- 
seccion de los dos conjuntos A y B es el conjunto de un solo elemento {(Xi.y!)}. 
Si presentimos que el primer resultado Xi no debe influir en el resultado y, parece 
razonable exigir que los sucesos A y B sean independientes. Esto significa que 
habra que definir la nueva funcion de probabilidad P de manera que 

(13.15) p(A r\ B) — P(A)P(B). 
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Si decidimos la forma de asignar las probabilidades P(A) y P(B), la ecuacior 
(13.15) nos dira como asignar la probabilidad P(A O B), esto es, la probabilidad 
P(x,, y0. Se presenta el suceso A si y solo si el resultado de la primera prueba es 
x x . Puesto que Pi(x,) es su probabilidad, parece natural asignar el valor P,(*i) 
tambien a P(A). Analogamente, asignamos a P(B) el valor P 2 ( yA. La ecuacion 
(13.15) nos da entonces 


P(x i , Vl) — L’l(-V 1 )P2(3 ; l) ■ 


Todo esto es, naturalmente, tan solo una justificacion para la asignacion de 
probabilidades (13.14). El unico camino para decidir si (13.14) es o no una acep- 
table asignacion de probabilidades puntuales es ver si se cumplen las propieda- 
des fundamentals de las medidas de probabilidad. Cada numero P(x, y) es no 
negativo, y la suma de todas las probabilidades puntuales es igual a 1, puesto que 
tenemos 


I P(x, y ) = 2 Px(x) ■ I P,(y) = 1-1 = 1. 

(x.v)eS xeSi yeS 2 


Cuando decimos que una prueba compuesta E esta determinada por dos prue¬ 
bas E t y £ 2 estocasticamente independientes, queremos decir que el espacio de 
probabilidad (S,-J$,P) esta definido como acabamos de explicar, tal indepen¬ 
dence queda reflejada en el hecho de que P(x, y) es igual al producto P l {x) P 2 (y). 
Puede demostrarse que la asignacion de probabilidades (13.14) implicala igualdad 

(13.16) P(U x V) = P l (U)PM) 

para todo par de subconjuntos U de y V de J? 2 . (Vease el ejercicio 12 de la 
seccion 13.23 donde se esboza la demostracion.) De esta forma deduciremos algu- 
nas consecuencias importantes. 

Sea A un suceso (de la prueba compuesta £) de la forma 

A = C\ x S 2 , 

donde C\ e SA X . Cada resultado de A es un par ordenado (x, y) siendo x un resul¬ 
tado de C x (en la primera prueba £,) mientras que y puede ser cualquier resultado 
de S 2 (en la segunda prueba £ 2 ). Si aplicamos (13.16) encontramos: 

P(A) = P(C ! x S 2 ) = P 1 (C l )P 2 (S 2 ) = PACJ, 

ya que P 2 (S 2 ) = 1. De este modo la definicion de P asigna la misma probabilidad 
a A que la asignada por P t a Ci. Por esta razon, se dice que un tal suceso A esta 
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determinado mediante la primera prueba E x . Analogamente, si B es un suceso 
de E de la forma 


B = S l x C 2 , 

perteneciendo C 2 e 38 2 , tenemos: 


P{B) = P(S X x C 2 ) = /» l (S 1 )P*(C 2 ) = P 2 (C 2 ) 


y se dice que B esta determinado por la segunda prueba E 2 . Demostraremos ahora, 
utilizando (13.16), que tales sucesos A y B son independientes. Esto es, tenemos: 

d 3 - 17 ) P{A n B) = P(A)P(B). 

Ante todo notemos que 

A n B = {(x, y) | (x, y) e C, x S 2 y (x, y) e S x x C 2 } 

= {{x,y)\xeC l y yeC 2 } 

= C, x C 2 . 

Luego, en virtud de (13.16), tenemos: 

(13.18) P(A n B) = P(C l x C 2 ) = PACAPAQ). 

Puesto que P^C,) = P(A) y P 2 (C 2 ) = P(B) obtenemos (13.17). Observese que 
la igualdad (13.18) tambien demuestra que podemos calcular la probabilidad 
P(A n B) como producto de las probabilidades en cada uno de los espacios mues- 
trales S x y S 2 ; luego no son precisos calculos con probabilidades en la prueba com- 
puesta. 

La generalizacion a pruebas o experiencias compuestas de n pruebas £ 1( E 2 , 

• ■. ,E n se deduce en la misma forma. Los puntos en el nuevo espacio muestral 
son fl-plas (x ly x 2 ,. .., x„) y las probabilidades se definen como producto de las 
probabilidades de los resultados particulares 

(13.19) P(x x ,x 2 ,... ,x n ) = P l (x 1 )P 2 (x 2 ) ■ • • P n (x n ). 

Cuando se adopta esta definicion de P decimos que E esta determinado por n prue¬ 
bas independientes E lt E 2 ,..., E„. En el caso particular en el que todas las 
pruebas estan asociadas al mismo espacio de probabilidad, la prueba compuesta E 
es un ejemplo de pruebas independientes repetidas bajo identicas condiciones. En 
la seccion siguiente se considera un ejemplo. 



Pruebas de Bernoulli 


603 


13.16 Pruebas de Bernoulli 

Un ejemplo importante de prueba compuesta lo estudio Jacobo Bernoulli y lo 
conocemos por el nombre de sucesidn de pruebas de Bernoulli. Se trata de una 
sucesion de pruebas repetidas ejecutadas en las mismas condiciones, siendo cada 
resultado estocasticamente independiente de las demas. Cada prueba tiene exacta- 
mente dos resultados posibles, corrientemente llamados «exito» y «fallo»; la pro- 
babilidad del exito se representa por p y la del fallo con q. Naturalmente, 
q = 1 — p. El teorema principal relacionado con las sucesiones de Bernoulli es el 
siguiente: 

teorema 13.3. f6rmula de Bernoulli. La probabilidad de k exitos en 
n pruebas de Bernoulli es 

(13.20) 

donde [ n ) representa el coejiciente binomial, =-—-. 

\kl \k/ k\ {n — k)\ 

Demostracion. Representemos el «exito» con S y el «fallo» con F y considere- 
mos una sucesion particular de n resultados. Esto puede representarse mediante 
una n-pla. 


(x l ,x 2 ,...,x n ), 

donde cada x, es S o F. El suceso A en el que estamos interesados es la coleccion 
de todas las n-plas que contienen exactamente k veces la S y n — k veces la F. 
Calculemos la probabilidad de una n-pla determinada de A. La probabilidad de 
cada S es p, y la de cada F es q. Luego, en virtud de (13.19), la probabilidad de 
cada n-pla de A es el producto de k factores iguales a p por n — k factores q. 
Esto es. 


-F(.vi, X 2 , .. . , x n ) — p k q ' si (x^, x %,.. . , x n ) £ A . 


Por lo tanto, para calcular P(A) tan sdlo tenemos que contar el numero de elemen- 
tos de A y multiplicar dicho numero por p k q n ~ k . Pero el numero de elementos 
de A es simplemente el numero de maneras de colocar k veces la S en las n posi- 
ciones posibles de n-pla. Esto es lo mismo que el numero de subconjuntos de k 
elementos que pueden formarse con un conjunto de n elementos; sabemos ya que 
este numero es ()!). De ahi que, si sumamos las probabilidades correspondientes 
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a todos los puntos de A obtenemos: 

P(A) = QpV-*. 

ejemplo 1. Se lanza 50 veces una moneda. Calcular la probabilidad de que 
salgan 25 caras exactamente. 

Solucion. Interpretamos este juego como una sucesion de 50 pruebas de 
Bernoulli, en las que «exito» significa «cara» y «fallo» sera «cruz». Supuesta la 
moneda correcta asignamos las probabilidades p = q = i/ 2 , y la formula (13.20) 
nos da (i?)(|) 50 como probabilidad de obtener exactamente k veces cara en 50 
tiradas. En particular, si k = 25 obtenemos: 

/50\ /Tf_ 50! /If 
\25/ \2/ 25! 25! \2/ 

Para expresar este numero en forma decimal es mejor utilizar logaritmos, y mane- 
jando tablas de logaritmos de factoriales. Designando el numero buscado por P, 
en logaritmos base 10 obtenemos 

log P = log 50! - 2 log 25! - 50 log 2 

= 64.483 - 50.381 - 15.052 = -0.950 = 0.05 - 1.00 
= log 1.12 - log 10 = log0.112, 
asf que P = 0,112. 

ejemplo 2. £Cual es la probabilidad de conseguir r exitos por lo menos 
en n pruebas de Bernoulli? 

Solucion. Sea Ak el suceso «obtener exactamente k exitos en n pruebas». 
El suceso E que analizamos es la reunion 

£=A r UA r+1 u • ■ • UA n . 

Ya que los Ak son disjuntos, encontramos: 

n n 

P(E ) =ZP(Ak) =2(fcW' fc - 
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Puesto que, 

p k q”~ k = (p + q) n = 1, - 

la probabilidad del suceso complementario E' puede calcularse asf: 

r—1 

P(E')= i - p(£)=2(£)pV“*- 

Esta ultima suma nos da la probabilidad de lograr por lo menos r — 1 exitos en 
n pruebas. 

13.17 Numero mas probable de exitos en n pruebas de Bernoulli 

Un par de dados correctos es lanzado 28 veces. <i,Cual es el numero mas pro¬ 
bable de sietes? Para resolver este problema designemos con f(k) la probabilidad 
de obtener exactamente k sietes en 28 tiradas. La probabilidad de conseguir un 
siete en una tirada es %. La formula de Bernoulli nos dice que 



m = 




5\ 28 -* 
6 / 


Queremos determinar que valor (o valores) de k entre los valores k = 0, 1,2, 
.... 28 hacen maximo a f(k). El siguiente teorema resuelve la cuestion para cual- 
quier sucesion de pruebas de Bernoulli. 

teorema 13.4. Dados un entero n ^ 1 y un numero real p, 0 < p < 1, 
consideremos el conjunto de numeros 


m = (J!) /(I - p) n -\ para k = 0, 1, . . . , n. 

a) Si (n + l)p no es entero, el maximo de f(k) se presenta exactamente 
para un valor de k: 

k = [{n + i)p], el mayor entero < (n + 1 )p. 

b) Si (n + l )p es entero, el maximo de f(lc) se presenta exactamente para 
dos valores de k\ 


k = (n + 1 )p 


y k = (n + \)p — 1. 
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Demostracion. Para estudiar el comportamiento de f(k) consideremos la 
razon 


r (k\ - _ k + 1 1 ~ P 

{ f(k + 1) n — k p 

para k = 0,1.1. La funcion rik) es creciente en sentido estricto por lo 
cual tenemos 

0 < r(0) <r(l) < •• • < r(n - 1). 

Vamos a considerar seis casos, representados en la figura 13.2. En los tres prime- 
ros demostramos que f(k) toma su valor maximo para un solo valor de k. En los 
restantes j(k) alcanzan su maximo para dos valores consecutivos de k. 



Caso l 


Caso 2 


Caso 3 




Caso 5 Caso 6 


Figura 13.2 Calculo del numero mas probable de exitos en n pruebas de Bernoulli. 


CASO 1. r('0) > 1. En este caso r(fc) > 1 para todo k con lo que 

/( 0 ) >/( 1 ) > • >/(«). 

Por consiguiente el valor maximo de f(k) se presenta solo para k — 0. Tambien, 
r(0) = (1 - p)/{np)> 1, as! que 1 - p >np, (n + l)p<l, luego [(n+l)p] = 0. 
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CASO 2. tin — 1) < 1. En este caso r(k) < 1 para todo k con lo que 
/(0) < /(1) < ... < fin) y el valor maximo de f(k) se presenta solo para k = n. 

Puesto que r(n — 1) = n(l - p)/p < 1, tenemos n - np < p, luego n < (n + Dp 

< n + 1, asi que [(« + l)p] = n. 

CASO 3. r(0) < 1, r(n — 1) > 1, y r(k) * 1 para todo k. En este caso hay 

un unico entero s, 0 < s < n, tal que r(s - 1) < 1 y r(s) > 1. La funcion f(k) es 
creciente en el intervalo 0 <k <s y decreciente en el intervalo 5 < k < n. Por 
-onsiguiente f(k) tiene un solo maximo en k — s. Puesto que r(s — D = s(l — p)/ 
(np - sp + p) < 1 tenemos s < (n + 1 )p. La desigualdad r(s) > 1 demuestra 

que (n + 1)P < s + 1, luego [(n + Dp] = s. 

Observese que en cada uno de los tres primeros casos el valor maximo de 
f(k) se presenta cuando k = [(n + Dp]; asimismo (n + l)p no es entero en 
ninguno de esos casos. 

CASO 4. r(0) < 1, r(n — 1) > 1, y r(s - D = 1 para un cierto s, 
2 < s < n. En este caso f(k ) crece para 0 < k < s — 1 y decrece para s < k < n. 
El valor maximo de f(k) se presenta dos veces, cuando k = s — 1 y cuando k = s. 
La ecuacion r(s — 1) = 1 implica (n + \)p = s. 

CASO 5. r(n - 1) = L En este caso r(k) < 1 para k ^ n - 2, asi que 
f(k) crece en el intervalo 0 ^ k ^ n - 1, y f(n - D = /(«)• Luego f(k) tiene dos 
maximos, cuando k = n - 1 y cuando k = n. La ecuacion r(n - D = 1 implica 
(n + 1)P = n. 

CASO 6. r(0) = 1. En este caso r(k) > 1 para k > 1, asi que f(k) decrece 
en el intervalo 1 < fc < n. Los maximos de f(k) son dos, cuando k — 0 y cuando 
k = 1. La ecuacion r(0) = 1 implica (n + D p — L 

En cada uno de los tres ultimos casos el valor maximo de f(k) ocurre para 
k = (n + 1)P y para k = (n + Dp — L Esto completa la demostracion. 

ejemplo 1. Un par de dados se lanza 28 veces. iCual es el numero mas 
probable de sietes? 

Solucidn. Se aplica el teorema 13.4 con n = 28, p — Ye, y (n + l)p = 

Este no es un entero con lo cual el valor maximo de f(k ) se presenta pari 

k= m =4. 

Observacion: Si se echan los dados 29 veces hay dos soluciones, k =4 y k =5 

ejemplo 2. Hallar el menor n tal que si se tiran dos dados correctos i 
veces la probabilidad de conseguir cuatro sietes es por lo menos tan grande comi 
la de obtener cualquier otro numero de sietes. 
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Solucidn. Tomamos p = % en el teorema 13.4. Queremos que el maximo 
de f(k) ocurra cuando k = 4. Esto exige o bien que [(«+l)p]=4, (n + 1) p = 4, 
o (m + l)p — 1 = 4. El menor valor de n que satisface cualquiera de esas rela- 
ciones es n = 23. 

13.18 Ejercicios 

1. Se lanza una moneda dos veces, la probabilidad de cara en la primera tirada sea pi y 
en la segunda tirada pa- Consideremos esto como una prueba compuesta determinada 
por dos pruebas estocasticamente independientes, y sea el espacio muestral 


S = {(H, H), ( H , T), (T, H), (T, T)}. 

a) Calcular la probabilidad de cada elemento de S. 

b) iPuede ser la asignacion de las probabilidades pi y p 2 de modo que 

P(H, H) = J-, P{H, T) = P(T, H) = %, P(T, T) = f ? 

c) iPueden ser asignadas pi y po de modo que 

P(H, H) = P{T, T) = l, P(H, T) = P(T, H) = a? 

d) Considerar los cuatro sucesos siguientes (subconjuntos de S): 

Hi 2 3 4 5 , cara en la primera tirada, 

H 2 - cara en la segunda tirada, 

T i: cruz en la primera tirada, 

To: cruz en la segunda tirada. 

Determinar que pares de esos cuatro sucesos son independientes. 

En cada uno de los ejercicios del 2 al 12 determinar el espacio muestral, la asignacidn 
de probabilidades, y el suceso cuya probabilidad se calcule. 

2. Un estudiante debe rendir un examen consistente en 10 preguntas. No esta preparado 
para ello y se propone acertar las preguntas contestandolas al azar. Por ejemplo, puede 
lanzar una buena mor.eda y utilizar el resultado para determinar su pronostico. 

a) Calcular la probabilidad de que acierte correctamente por lo menos cinco veces. 

b) Calcular la probabilidad de que acierte correctamente por lo menos nueve veces. 

c) iCual es el menor valor de n tal que la probabilidad de acertar por lo menos n 

respuestas correctas es menor que I ? 

3. Diez dados correctos se lanzan juntos. iCual es la probabilidad de obtener exactamente 
tres seises? 

4. Se lanza cinco veces una moneda correcta. iCual es la probabilidad de obtener a) tres 
caras exactamente, b) por lo menos tres caras, c) por lo menos una cara? 

5. Un hombre afirmaba poseer una varilla con la que podia localizar yacimientos de petro- 
leo. El Departamento de Geologia de Caltech realizo el siguiente experimento para poner 
a prueba su afirmacion. Fue colocado en una habitacion donde habia 10 barriles precin- 
tados. Se le advirtio que cinco de ellos contenian petroleo y los otros cinco agua. 
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Su trabajo consistio en decidir cuales contenfan petroleo y cuales agua. 

a) iCual es la probabilidad de que localizara correctamente los cinco barriles de pe¬ 
troleo tan solo por azar? 

b) <iCual la de que localizara por lo menos Ires de los barriles de petroleo unicamente 
por azar? 

6. Una anciana de Pasadena afirma que probando una taza de te con leche puede decir 
que fue lo primero que se puso en la taza: el te o la leche. Tal afirmacion se pone a 
prueba-haciendole degustar y clasificar 10 pares de tazas de t6, conteniendo cada par 
una taza de te servida de cada una de las dos tnaneras citadas. Sea p su probabilidad 
«cierta» de clasificar un par de tazas correctamente. (Si ella es habil, p es substancial- 
mente mayor que si no lo es, p<\.) Se supone que los 10 pares de tazas son clasi- 
ficadas bajo condiciones identicas e independientes. 

a) Calcular, en funcion de p, la probabilidad de que clasifique correctamente por lo 
menos ocho de los 10 pares de tazas. 

b) Valorar esta probabilidad explicitamente cuando p — \ . 

7. (Otro problema del caballero de Mere.) Determinar si es o no ventajoso jugar apos- 
tando cantidades iguales, a que por lo menos aparece un 6 en cuatro tiradas de un 
dado correcto. [Indicacidn. Probar que la probabilidad de sacar por lo menos un 6 en 
n tiradas es 1 — (f)".] 

8. Una urna contiene a bolas blancas y b bolas negras. Si k < n, calcular la probabilidad 
de sacar k bolas blancas en n extracciones, si cada bola es devuelta a la urna antes de 
sacar la siguiente. 

9. Se lanzan dos dados ocho veces. Calcular la probabilidad de que la suma sea 11 exacta- 
mente tres veces. 

10. Se lanza una moneda 10 veces o 10 monedas una vez y se cuenta el numero de caras. 
Encontrar la probabilidad de obtener por lo menos seis caras. 

11. Despues de una larga serie de tests aplicados a cierto tipo de cohete se ha determinado 
que aproximadamente en un 5 % de pruebas se producira un mal funcionamiento que 
sera la causa de que el cohete fracase. Calcular la probabilidad de que en 10 pruebas 
haya por lo menos un fallo. 

12. Se lanza repetidamente una moneda. Calcular la probabilidad de que el numero total 
de caras sea por lo menos 6 antes de que el numero total de cruces sea 5. 

13. El ejercicio 12 puede generalizarse como sigue: Demostrar que la probabilidad de que 
se produzcan por lo menos m exitos antes que n fallos en una sucesion de pruebas de 
Bernoulli es: 

fc=m 

14. Determinar todos los valores de n con la siguiente propiedad: Si se tira n veces un par 
de dados correctos, la probabilidad de obtener exactamente diez sietes es por lo menos 
tan grande como la de obtener cualquier otro numero de sietes. 

15. Una maquina tragamonedas binaria tiene tres ruedas identicas e independientes. Cuando 
se juega con la maquina los resultados que pueden obtenerse son ternas ordenadas 
(x,y,z), en donde cada una de las letras x,y,z puede ser 0 6 1. En cada rueda la 
probabilidad de 0 es p y la probabilidad de 1 es 1 — p, en donde 0< p < 1. La maquina 
paga 2$ si el resultado es (1,1,1) o (0,0,0); paga 1$ si se obtiene el resultado (1,1,0); 
en cualquier otro caso no paga nada. Designemos con f(p) la probabilidad de que la 
maquina pague un dolar o mas cuando se haga una tirada. 

a) Calcular f(p). 



610 


Funciones de conjunto y probabilidad elemental 


b) Definamos el «pago total* como la suma \. r( , s - g (x)P(x), en donde S es el espacio 
muestral, P(x) es la probabilidad del resultado x, y g(x) el numero de dolares pagados 
por el resultado x. Calcular el valor de p para el cual el «pago total* sea mi'nimo. 

13.19 Conjuntos numerables y no numerables 

Hasta aqui solo hemos considerado el concepto de probabilidad para espa- 
cios muestrales finitos. Queremos ahora extender la teoria a espacios muestrales 
infinitos. Para ello es necesario distinguir dos tipos de conjuntos infinitos, los 
numerables y los no numerables. En esta section se estudian ambos. 

Para contar los elementos de un conjunto finito se pone en corresponden- 
cia el conjunto, elemento a elemento, con el conjunto de los numeros naturales 
{1, 2,. ..,«}. La comparacion de los «tamanos» de dos conjuntos mediante la 
correspondencia entre ellos elemento a elemento sustituye el recuento de los ele¬ 
mentos cuando se trata de conjuntos infinitos. A este proceso se le puede dar una 
clara formulation matematica empleando el concepto de funcion: 

definicion Se dice que dos conjuntos A y B estdn en correspondencia uno 
a uno si existe una funcion f con las propiedades siguientes: 

a) El dominio de f es A y el recorrido de f es B. 

b) Si x e y son elementos distintos de A, entonces fix) y f(y) son elementos 
distintos de B. Esto es, para todo par de elementos x e y de A, 

(.LL21) .r# r implica fix) ^ f(v). 

Una funcion que satisfaga la propiedad (13.21) se llama uno a uno sobre A. 
Dos conjuntos A y B en correspondencia uno a uno se llaman tambien equivalen- 
tes, e indicamos esto poniendo A ~ B. Resulta claro que todo conjunto A es equi- 
valente a si mismo, puesto que f(x) = x para cada x de A. 

Un conjunto puede ser equivalente a un subconjunto de si mismo. Por ejemplo 
el conjunto P={ 1,2,3. . .}, compuesto por todos los numeros enteros positivos, 
es equivalente a su subconjunto Q = { 2,4,6. ..} compuesto por los pares positi¬ 
vos. En este caso, la funcion uno a uno que los hace equivalentes es f(x) — 2x 
para todo x de P. 

Si A ~ B es facil de demostrar que B ~ A. Si / es uno a uno en A y si el 
recorrido de / es B, entonces para cada b en B existe excatamenet un a en A tal 
que f(a) — b. De ahi que podemos definir una funcion inversa g en B del modo 
siguiente: Si b e B, g(b) = a, donde a es el unico elemento de A tal que f{a) = b. 
Esta g es uno a uno en B y su recorrido es A; luego B ~ A. Esta propiedad de 
equivalencia se llama simetria. 


(13.22) 


A ~ B implica B A . 
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Tambien es facil demostrar que la equivalencia tiene la propiedad siguiente, 11a- 
mada transitividad: 

(13.23) A~B y B~C implica A~C. 

En el ejercicio 2 de la seccion (13.20) se propone una demostracion de la propie¬ 
dad transitiva. 

Un conjunto S se denomina finito y se dice que contiene n elementos si 

5~{1,2,. 

El conjunto vacio tambien se considera finito. A los conjuntos que no son finitos 
se les llama infinitos. Un conjunto S se llama infinito numerable si es equivalente 
al conjunto de todos los numeros naturales, esto es, si 

(13.24) S'— {1, 2, 3,...}. 

En este caso existe una funcion f que establece una correspondencia uno a uno 
entre los enteros positivos y los elementos de S; luego el conjunto S puede expre- 
sarse segun la notacion en lista asi: 

S = {/(l),/(2),/(3),...}. 

A menudo utilizamos subfndices y representamos f(k) con ak (o con una notacion 
parecida) y escribimos S = {a u a 2 , a 3 , La idea importante es aqui que la 
correspondencia (13.24) nos permite usar los metodos naturales como «marcas» 
de los elementos de S. 

Un conjunto se dice que es numerable en sentido amplio si es finito o infinito 
numerable. Un conjunto que no es numerable se llama no numerable. (Se daran 
ejemplos.) Muchas operaciones con conjuntos efectuadas sobre conjuntos nume¬ 
rables producen conjuntos numerables. Por ejemplo, tenemos las propiedades si- 
guientes: 

a) Todo subconjunto de un conjunto numerable es numerable. 

b) - La interseccion de toda coleccion de conjuntos numerables es numerable. 

c) - La reunion de una coleccion numerable de conjuntos numerables es nu¬ 
merable. 

d) El producto cartesiano de un numero finito de conjuntos numerables es 
numerable. 

Puesto que en este Iibro trataremos muy poco de los conjuntos infinitos nu¬ 
merables, no daremos con detalle las demostraciones de sus propiedades.(*) En 
cambio, ofrecemos varios ejemplos para poner de manifiesto como con ellas se 
pueden construir nuevos conjuntos numerables a partir de unos dados. 


(*) En los ejercicios 3 al 8 de la seccion 13.20 se esbozan las demostraciones. 



612 


Funciones de conjunto y probabilidad elemental 


ejemplo 1. El conjunto S de todos los numeros enteros (positivos, negativos 
y el cero) es numerable. 

Demostracion. Si n e S, sea f(n) = 2n si n es positivo, y f(n) = 2'n\ + 1 
si n es negativo o cero. El dominio de / es S y su recorrido es el conjunto de ente¬ 
ros positivos. Puesto que / es uno a uno en S, se deduce que S es numerable. 

ejemplo 2. El conjunto R de todos los numeros racionales es numerable. 

Demostracion. Para cada entero n > 1 fijo, sea S„ el conjunto de numeros 
racionales de la forma x/n, donde x pertenece al conjunto S del ejemplo 1. Cada 
S„ es equivalente a S [tomese /(f) = nt si t e S„] y por consiguiente cada S n es 
numerable. Puesto que R es la reunion de todos los S n , en virtud de la propie- 
dad c) resulta R numerable. 

Observacion. Si & — {A\, A<>, ... } es una coleccion numerable de conjuntos, 

la reunion de todos ellos se expresa con el simbolo 

00 

U A k ° A x u A , U A , ej ■ ■ ■. 

L=1 

ejemplo 3. Sea A = {a u a 2 , a 3 ,..., } un conjunto infinito numerable. 
Para cada entero n > 1, sea la familia de subconjuntos de A con n elemen- 
tos. Esto es: 

— {S | S s A y S tiene n elementos}. 

Vamos a probar que cada -¥ n es numerable. 

Demostracion. Si S es un subconjunto de n elementos de A, podemos es- 
cribir: 


donde k ± < k 2 < ... < k„. Sea /(S) = {n ki , a ki , ... , flj. n ).Esto es, / es la fun- 
cion que asocia a S la n-pla ordenada ( a ki ,a k2 ,... , a k J. El dominio de f es f,y 
su recorrido, que designamos con T n , es un subconjunto del producto cartesiano 
C n — AxAx...XA(n factores). Ya que A es numerable, lo mismo le ocurre 
a C„ [por la propiedad d)] y, por lo tanto, T n tambien lo es [por la propiedad 
a) ]. Pero ,W n puesto que / es uno a uno. Esto demuestra que ..'F n es nu¬ 
merable. 

ejemplo 4. La coleccion de todos los subconjuntos finitos de un conjunto 
numerable es numerable. 

Demostracion. El resultado es evidente si el conjunto dado es finito. Supon- 
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gamos, pues, que el conjunto dado (llamemosle A) es infinito numerable, y repre- 
sentemos con & la clase de todos los subconjuntos finitos de A: 

& = {S\S^AySes finito} 

En estas condiciones es la reunion de todas las familias del ejemplo 3; 
luego, en virtud de la propiedad c), J 5 ” es numerable. 

ejemplo 5. La coleccion de todos los subconjuntos de un conjunto infinito 
numerable es no numerable. 

Demostracion. Sea A el conjunto numerable dado y -a/ la familia de todos 
los subconjuntos de A. Supondremos que s# es numerable y llegaremos a una con¬ 
tradiccion. Si stf es numerable, entonces sf ~ A y por tanto existe una funcion / 
uno a uno cuyo dominio es A y cuyo recorrido es stf. Asf, para cada a de A, el 
valor /(a) de la funcion es un subconjunto de A. Este subconjunto puede o no 
contener el elemento a. Designemos con B el conjunto de elementos a tales que 
a $f(a). Asf 


B = {a | a e A peroa £/(a)}. 

Siendo B un subconjunto de A, debe pertenecer a la familia s/. Esto signi- 
fica que B — j(b) para algun b de A. Existen ahora dos posibilidades: i )beB, o 
ii) b $ B. Si b 6 B, segun la definicion de B tenemos b $f(b), que es una contra- 
diccion, ya que f(b) = B. Por tanto i) es imposible. En el caso n), b <£ B, o sea, 
b $ f(b) . Esto contradice la definicion de B, con lo que n) tambien es imposible. 
Por consiguiente, el suponer que s/ es numerable nos lleva a una contradiccion y 
debemos concluir que stf es no numerable. 

A continuacion ofrecemos un ejemplo de conjunto no numerable mas sencillo 
que el del ejemplo 5. 

ejemplo 6. El conjunto de numeros reales x que satisfacen 0 < x < 1 es 
no numerable. 

Demostracion. Supongamos otra vez que el conjunto es numerable y llega¬ 
remos a una contradiccion. Si el conjunto es numerable podemos disponer sus 
elementos asf: {x l5 x 2 , x 3 ,... }. Construiremos ahora un numero real y que cum- 
pla 0 < y < 1 y que no estara en la lista. A tal fin escribimos cada elemento x n 
en forma decimal: 


x n a Ut 2 3, 
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donde cada a„,, es uno de los enteros del conjunto {0, 1, 2,... ,9}. Sea y el nu- 
mero real cuyo desarrollo decimal es: 

y = o -yiyty*-- ■, 

donde, 

1 S1 a n.n 1 > 

U si a nn = 1. 

De este modo ningun elemento del conjunto {x lt x 2 , x 3 ,... } puede ser igual a y, 
puesto que y difiere de x t en la primera cifra decimal, de x 2 en la segunda, y en 
general, difiere de x* en la k-e sima cifra decimal. Por tanto y satisface 0 < y < 1, 
lo cual es una contradiction, lo que prueba que el conjunto de numeros reales del 
intervalo abierto (0,1) es no numerable. 

13.20 Ejercicios 


1. Sea P = { 1,2,3,...} el conjunto de los numeros naturales. Para cada uno de los si- 
guientes conjuntos, dar una funcidn uno a uno f cuyo dominio es P y cuyo recorrido 
es el conjunto en cuestion: 

a) A = {2,4,6,...}, conjunto de los numeros pares positivos. 

b) B — {3,3 2 , 3 3 4 5 ,...}, conjunto de las potencias de 3. 

c) C = {2,3, 5, 7,11,13,...}, conjunto de los numeros primos. [Not a. Una parte de 
la demostracion consiste en demostrar que C es un conjunto infinito.] 

d) P X P, producto cartesiano de P por si mistno. 

e) El conjunto de enteros de la forma 2”3*, donde m y n son naturales. 

2. Demostrar la propiedad transitiva de la equivalencia de conjuntos 

Si A ~ B y B ~ C, entonces A ~ C. 

[ Indicacidn . Si / hace A equivalente a B y g hace B equivalente a C, demos¬ 
trar que la funcion compuesta A = g«/ hace A equivalente a C.] 

Los ejercicios del 3 al 8 estan dedicados a las demostraciones de las propiedades a), b), 
c), d) de los conjuntos' numferables citadas en la seccidn 13.19. 

3. Demostrar que todo subconjunto de un conjunto numerable es numerable. [Indicacidn. 
Supongase S un conjunto infinito numerable, sea S = [xi, x 2 ,x 3 ,y sea A un sub¬ 
conjunto infinito de S. Sea k( 1) el menor numero natural m tal que x m 6 A. Admi- 
tamos que k(l), k(2),.. . ,k(n — 1) esten definidos, sea k(n) el menor numero natural 
m > k(n — 1) tal que x m E A. Sea f(n) = Xk (n) . Demostrar que / es una funcion uno a 
uno cuyo dominio es el conjunto de los numeros naturales y cuyo rango es A. Esto 
demuestra el teorema en el supuesto de que S sea infinito numerable. Construir otra de¬ 
mostracion para S finito.] 

4. Demostrar que la interseccidn de cualquier coleccion de conjuntos numerables es nu¬ 
merable. [ Indicacidn. Utilizar el resultado del ejercicio 3.] 

5. Sea P = { 1,2,3,...} el conjunto de los numeros naturales. 

a) Demostrar que el producto cartesiano P X P es numerable. [ Indicacidn. Desfgnese 
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con Q el conjunto de numeros naturales de la forma 2"Y, donde my n son naturales. 
Entonces Q c P, de modo que Q es numerable (en virtud del ejercicio 3). Si 
(m, n) e P X P, tomese j(m, n) = 2“3” y utilizar esta funcidn para demostrar que 
PxP~ Q.] 

b) Deducir de a) que el producto cartesiano de dos conjuntos numerables es numera¬ 
ble. Utilizar el metodo de induction y extender el resultado a n conjuntos numerables. 

6. Sea 38 = {Bj, B 2 ,B 3 , • • •} una coleccion numerable de conjuntos disjuntos (B* nB, = 0 

oo 

si i & j) tal que cada B„ es numerable. Demostrar que la reunion (J B k es tambien 

00 *=1 

numerable. [ Indicacidn . Sea Bn = {b t n , b 2 n , b 3 n ,. . .}y S= [j B k . Si x 6 S, en- 

k=l 

tonces x = b m ,„ para algun unico par (m,«) y podemos definir /(x) = (m, n). Utilizar 
esta / para demostrar que S es equivalente a un subconjunto de PxP y deducir (en 
virtud del ejercicio 5) que S es numerable.] 

7. Sea srf = {A\, Ao, As,...} una colecci6n numerable de conjuntos, y definamos 
3$={Bi,B 2 ,B 3 ,...} asi: Bi-Ax y.para n > 1, 

n—1 

jB n — U A %. 

s=i 

Esto es, B„ consta de los elementos de A„ que no pertenecen a los conjuntos preceden- 
tes Ai, A 2 , ■ ■ ■ An-i- 

Demostrar que 38 es una colecci6n de conjuntos disjuntos (B, n B, = 0 si i ^ j) y que 


CO 00 

IM* = UB k . 

Esto nos permite expresar la reunion de cualquier coleccidn numerable de conjuntos 
como reunidn de una coleccion numerable de conjuntos disjuntos. 

8. Si es una coleccion numerable de conjuntos numerables, demostrar que la reunion 
de todos los conjuntos de es numerable. [ Indicacidn. Utilizar los ejercicios 6 y 7.] 

9. Demostrar que los siguientes conjuntos son numerables: 

a) El conjunto de todos los intervalos del eje real con extremos racionales. 

b) El conjunto de todos los circulos del piano con radios racionales y centros de 
coordenadas racionales. 

c) Cualquier conjunto de intervalos disjuntos de longitud positiva. 

10. Demostrar que los siguientes conjuntos son no numerables: 

a) El conjunto de los numeros irracionales del intervalo (0,1). 

b) El conjunto de todos los intervalos de longitud positiva. 

c) El conjunto de todas las sucesiones cuyos terminos son los enteros 0 y 1. (Recu6r- 
dese que una sucesidn es una funcion cuyo dominio es el conjunto de los numeros 
naturales.) 


13.21. Definicidn de probabilidad para espacios muestrales infinitos numerables 

En esta seccion se extiende la definicion de probabilidad a espacios muestra¬ 
les infinitos numerables. Sean S un conjunto infinite numerable y 38 un algebra 
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de Boole de subconjuntos de S. Definamos una medida de probabilidad P e o. 38 
como se hizo en el caso finito, excepto que exigiremos la aditividad numerable 
ademas de la aditividad finita. Esto es, para toda coleccion infinita numerable 
{A 1 , A 2 ,... } de elementos de 88, exigimos que 


(13.25) W U A k \ — 2 P(A k ) si A i n A } - = 0 siempre que i ¥=j. 

Las funciones de conjunto de aditividad finita que satisfacen (13.25) se llaman de 
aditividad numerable (o completamente aditivas). Naturalmente, esta propiedad 
exige tambien suponer que la reunion numerable A x U A 2 U A 3 u ■ ■ ■ pertenece 
a 88 cuando cada Ak pertenezca a 88. No todas las algebras de Boole tienen esta 
propiedad. Las que la tienen se llaman <r-algebras de Boole. Un ejemplo es el 
algebra booleana de todos los subconjuntos de S. 

DEFINICION DE PROBABILIDAD PARA ESPACIOS MUESTRALES INFINITOS NUME- 

rales. Sea 88 una c-algebra de Boole cuyos elementos son subconjuntos de un 
conjunto infinito numerable S dado. Una funcion de conjunto P se llama medida 
de probabilidad en 88 si es no negativa, de aditividad numerable y satisface 
P(S)=1. 

Cuando 88 es el algebra de Boole de todos los subconjuntos de S, una fun¬ 
cion de probabilidad queda completamente determinada mediante sus valores para 
los subconjuntos de un solo element,o (tales valores se llaman probabilidades pun- 
tuales). Todo subconjunto A de S es finito o infinito numerable, y la probabilidad 
de A se calcula sumando las probabilidades puntuales para todos los elementos 
de A, 


P(A) = 2P(x). 

xeA 

La suma del segundo miembro tiene un numero finito de sumandos o es una serie 
absolutamente convergente. 

El ejemplo que sigue muestra un ejemplo de una prueba con un espacio mues- 
tral infinito numerable. 

ejemplo. Se lanza una moneda repetidamente hasta que el primer resul- 
tado vuelve a aparecer por segunda vez; entonces termina el juego. 

Como espacio muestral tomamos la coleccion de todos los posibles juegos que 
pueden hacerse. Este conjunto puede expresarse como la reunion de dos conjuntos 
infinitos numerables A y B que son 

A = {7T, THT, THHT, THHHT, . . .) y B = {HH, HTH, HTTH, HTTTH, . . .}. 
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Designamos los elementos del conjunto A (en el orden en que se citan en la lista) 
con fl 0 , a u a 2 ,..., y los de B con b 0 , bi, b 2 ,... . Podemos asignar arbitraria- 
mente probabilidades puntuales no negativas P(a n ) y P(b„) con tal que 

lP(a n ) + 2P(b n )= 1. 

n —0 n=0 


Por ejemplo, supongamos que la moneda tenga probabilidad p de mostrar 
cara (H) y probabilidad q = 1 — p de mostrar cruz (T), siendo 0 < p < 1. En- 
tonces seria natural la asignacion de probabilidades puntuales 


(13.26) 


P(a n ) = fp n y p (K) — p\ n ■ 


Tal asignacion-es aceptable porque tenemos 

oo oo oo oo 

+J,P(b n ) = q^P n + P^q n 

71=0 72=0 72=0 72=0 




= q + p = 1. 


Supongamos ahora que queremos saber la probabilidad de que el juego ter- 
mine despues de exactamente n + 2 lanzamientos. Este es el suceso {cu} u { b„}, 
y su probabilidad es 


P(a n ) + P(b n ) = q 2 p n + p 2 q n . 

La probabilidad de que termine el juego por lo menos en n + 2 lanzamien¬ 


tos es 


jvTi S 1 ~ P 1 — q 


= 1 - qp n+1 - pq n+1 . 


13.22 Ejercicios 

Los ejercicios de esta secci6n se refieren al ejemplo de la secci6n 13.21. 

1. Utilicemos las probabilidades asignadas en la ecuacidn (13.26), designemos con /„(p) la 
probabilidad de que el juego fmalice exactamente en n + 2 tiradas. Calcular los valores 
maximo y mmirno absolutos de f„(p) en el intervalo 0 < p < 1 para cada uno de los 
valores n = 0, 1, 2, 3. 

2. Demostrar que es aceptable cada una de las asignaciones de probabilidades puntuales 
siguientes. 


1 

a) P(a n ) = P(b n ) = 


para n = 0, 1, 2, . . . . 
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b) P(aJ = P(b n ) = (n + 2 l (n+3) P-a « “ 0, 1, 2,... . 

3. Calcular la probabilidad de que termine el juego antes de la quinta tirada, utilizando: 

a) las probabilidades puntuales de (13.26). 

b) las probabilidades puntuales del ejercicio 2 a). 

c) las probabilidades puntuales del ejercicio 2 b). 

4. Calcular la probabilidad de que se necesite un numero impar de tiradas para terminar 
el juego, utilizando: 

a) las probabilidades puntuales de (13.26). 

b) las probabilidades puntuales del ejercicio 2 a). 

c) las probabilidades puntuales del ejercicio 2 b). 


13.23 Ejercicios variados sobre probabilidades 

1. iCual es la probabilidad de conseguir un siete con dos d dos correctos? 

2. Diez senores y sus esposas estan sentados al azar en un banquete. Calcular la probabili¬ 
dad de que un determinado senor este sentado junto a su esposa si: a) estan sentados 
en una mesa circular; b) estan sentados en fila. 

3. Un armario tiene dos cajones. El cajon numero 1 contiene cuatro monedas de oro y dos 
de plata. El cajon numero 2 contiene tres monedas de oro y tres de plata. Se abre un 
cajon al azar y de el se extrae una moneda al azar. Calcular la probabilidad de cada 
uno de los siguientes sucesos: 

a) Que sea abierto el cajon numero 2 y se saque una moneda de plata. 

b) Que sea extraida una moneda de oro del cajon abierto. 

4. Dos cartas se escogen sucesivamente en una baraja de 52 cartas, teniendo cada carta la 
misma probabilidad de ser elegida. 

a) iCual es la probabilidad de que por lo menos una sea una espada? 

Sin examinar las dos cartas escogidas se echan en una bolsa. Se extrae de la bolsa 
una de las cartas y se examina viendose que no es una espada. (Cada carta tiene la 
misma probabilidad de ser extraida.) 

b) iCual es ahora la probabilidad de tener por lo menos una espada? 

La carta antes extraida de la bolsa se devuelve a la misma y las dos cartas se bara- 
jan. Nuevamente se extrae una carta y se examina. No hacemos comparacion alguna 
para ver si la carta es la misma que antes se extrajo. Otra vez se devuelve la carta 
a la bolsa y se barajan. Esta operacion se hace tres veces, incluyendo la de la parte b), 
y cada vez la carta examinada no es espada. 

c) iCudl es el espacio muestral y la funcion de probabilidad de este experimento? 
iCufil es la probabilidad de que una de las dos cartas originales sea espada? 

5. Un hombre tiene diez monedas de un centavo, 9 corrientes y 1 con dos caras. Toma 
una moneda al azar y la lanza seis veces, y siempre obtiene cara. Calcular la probabi¬ 
lidad de que haya tornado la moneda de dos caras. 

6. Demostrar que es imposible «lastrar» un par de dados de modo que todo resultado 
comprendido entre 2 y 12 tenga la misma probabilidad de presentarse. 

7. Un estudiante de segundo ano de Caltech tiene un despertador que sonara a las hora 
fijada con probabilidad 0,7. Si suena, le despertara a tiempo para llegar a su clase de 
matematicas con probabilidad 0,8. Si no suena, la probabilidad de que Uegue a su 
clase es 0,3. Calcular la probabilidad de que llegue a tiempo a clase. 

8. Tres caballos A, B, y C estan en una carrera. El suceso «A vence a B» se designara 
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simbolicamente escribiendo AB. El suceso «A vence a B el cual vence a C» se desig¬ 
nate por ABC, etc. Se sabe que 


P{AB) = |, P(AC) = f, P(BC) = \, 

y que 

P(ABC) = P(ACB), P(BAC) = P(BCA), P(CAB) = P(CBA). 

a) Calcular la probabilidad de que venza A. 

b) Calcular la probabilidad de que venza B. 

c) Calcular la probabilidad de que venza C. 

d) iSon independientes los sucesos AB, AC y CB? 

9. La fase final de un largo calculo exige la adicidn de tres enteros 01 , 02 , 03 . Se supone 
que: a) los calculos de ai, az y 03 son estocasticamente independientes; b) en el calculo 
de cada a, existe una misma probabilidad p de que sea correcto y la probabilidad de 
cometer un error igual a +1 es la misma que la de cometerlo igual a — 1; c) no puede 
cometerse error mayor que +1 o menor que —1. Recordar la posibilidad de compen- 
sacidn de errores, y calcular la probabilidad de que la suma 01 + 03 + 03 sea correcta 

10. El juego de «sale el non». Se supone que n personas lanzan cada una una moneda de 
manera simultanea e independiente, donde « > 3; y p es la probabilidad de obtener 
cara con cada una de las monedas. Calcular la probabilidad de que en una tirada dada 
se presente un «non»—, es decir, una persona cuya moneda muestra un resultado 
distinto del de todas las demas. 

11. Se supone que n personas juegan a «sale el non» con monedas correctas (como se ha 
descrito en el ejercicio 10). Para un entero m, calcular la probabilidad de que son 
necesarias precisamente m tiradas para que haya un «non». 

12. Supongamos que una experiencia compuesta (S, 9S, P)esta determinada por dos pruebas 

estocasticamente independientes (S x , 3ft x , P x ) y (S 2 , , P 2 ) donde S = Si X S 2 y 


P(x,y) = P i(x)P 2 (y) 

para cada ( x,y ) de S. El objeto de este ejercicio es establecer la formula 
27) PW XV)- Pt(U)P t (V) 

para todo par de subconjuntos U de 3ft x y V Los espacios muestrales Si y S 2 se 

suponen finitos o infinitos numerables. 

a) Comprobar que la igualdad (13.27) es verdadera cuando U y V son conjuntos de un 
solo elemento, y tambien cuando por lo menos uno de ellos es vacfo. 

Supongamos ahora que 

U — {u x , u 2 , ... , Wfc} y V — , v 2 ,... , v m } • 

En tal caso U X V consta de km pares (Ut, v,). Para cada i = 1,2,...., k sea A t el 
conjunto de m pares de U X V cuyo primer componente es u t . 

b) Demostrar que los Ai son conjuntos disjuntos cuya reuni6n es U X V. 

c) Demostrar que 


m 

P(.A t ) = 2 POtt.Vf) = PM)Pz<<V). 
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d) Deducir a partir de b) y c) que 

P(U x V) = \ P(Ad = P 1 (U)P 2 (V). 

i=l 
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14.1 Definicion de probabilidad para espacios muestrales no numerables 

Un segmento rectilmeo se descompone en dos partes, con el punto de sub¬ 
division elegido al azar. £Cual es la probabilidad de que los dos fragmentos tengan 
la misma longitud? ^.Cual es la probabilidad de que el mayor tenga exactamente 
longitud doble que la del pequeno? ^.Cual es la probabilidad de que el mayor ten¬ 
ga longitud por lo menos doble que el menor? fistos son ejemplos de problemas 
de probabilidad en los que el espacio muestral es no numerable ya que consta de 
todos los puntos del segmento. En esta section se extiende la definicion de proba¬ 
bilidad incluyendo los espacios muestrales no numerables. 

Si siguieramos el mismo proceso que para espacios muestrales numerables 
tendriamos que partir de un conjunto no numerable S cualquiera y una <r-a!gebra 
de Boole 88 de subconjuntos de S' y definir una medida de probabiljdad que fuera 
una funcion de conjunto P no negativa completamente aditiva definida sobre 88 
siendo P(S) = 1. Esto origina ciertas dificultades tecnicas que no se presentan 
cuando S es numerable. Pretender la description de esas dificultades nos llevaria 
demasiado lejos. Las evitaremos imponiendo restricciones iniciales al conjunto S 
y al algebra de Boole 88. 

Primeramente, restringimos S a ser un subconjunto del eje real R, o del 
n-espacio R". Para el algebra booleana 88 empleamos subconjuntos especiales de 
S que, en el lenguaje de la moderna teoria de la integracion, se llaman subcon¬ 
juntos de S medibles. No intentaremos describir el significado preciso de un con¬ 
junto medible; en cambio, mencionaremos algunas de las propiedades que posee 
la clase de los conjuntos medibles. 

Consideremos primero subconjuntos de R. Los subconjuntos medibles tienen 
las propiedades siguientes: 

1) Si A es medible, asimismo lo es R — A, complemento de A. 
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2) Si {A,, A 2 , A 3 ,... } es una coleccion numerable de conjuntos medi- 
bles, la reunion A x U A 2 U A 3 U ... tambien es medible. 

3) Todo intervalo (abierto, cerrado, semiabierto, finito o infinito) es medible. 

Asi pues, los conjuntos medibles de R forman una <x-algebra booleana que 
contiene los intervalos. Existe una <r-algebra booleana minima (en el sentido de la 
inclusion) que tiene esta propiedad; sus elementos se llaman conjuntos de Borel 
en atencion al matematico frances Emile Borel (1871-1956). Analogamente, en E 2 
existe un cr-algebra booleana minima que contiene todos los productos cartesianos 
de pares de intervalos; sus elementos son conjuntos de Borel. Los conjuntos de 
Borel en E„ se definen en forma analoga. 

De ahora en adelante, siempre que utilicemos un conjunto S de numeros rea¬ 
les como espacio muestral, o, mas general, siempre que se use un conjunto S de 
E n como espacio muestral, supondremos que este conjunto es un conjunto de Borel. 
Los subconjuntos de Borel de S forman asimismo una o--aIgebra de Boole; supon¬ 
dremos que nuestras medidas de probabilidad estan definidas sobre esas algebras 
de Boole. Dichas algebras son lo bastante amplias para incluir todos los sucesos 
que se presentan en las aplicaciones corrientes de la teoria de probabilidades. 

DEFINICldN DE PROBABILIDAD PARA ESPACIOS MUESTRALES NO NUMERABLES. 

Sean S un subconjunto de R”, y AS la u-algebra de Boole de subconjuntos de Borel 
de S. Una funcion de conjunto no negativa, completamente aditiva P definida en 
3$ con P(S ) = 1 se llama medida de probabilidad. La term ( S, 38, P) se llama 
espacio de probabilidad. 

14.2 Numerabilidad del conjunto de puntos con probabilidad positiva 

Para espacios muestrales numerables la probabilidad de un suceso A se cal- 
cula a menudo sumando las probabilidades puntuales l\x) para todo x de A. Este 
metodo es aplicable para espacios muestrales no numerables porque, como el si- 
guiente teorema pone de manifiesto, la mayor parte de las probabilidades pun¬ 
tuales son nulas. 


TEOREMA 14.1. si ( S,38,P ) es un espacio de probabilidad y si T es el 
conjunto de todos los x de S para los que P(x)> 0, entonces T es numerable. 


Demostracion. Para cada n — 1, 2, 3,..., designemos con T„ el siguiente 
subconjunto de S: 


71 = 


<P(x)<-\. 

n + ] n 


Si P(x) > 0 entonces x e T„ para un cierto n. Reciprocamente, si x e T„ para un 
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cierto n entonces x e T. Luego T = T x u T 2 u ■ ■ • . Ahora bien T„ contiene a 
lo sumo n puntos, pues si contuviera n + 1 puntos o mas la suma de sus proba- 
bilidades puntuales excederxa a 1. Por lo tanto T es numerable, puesto que es una 
reunion de conjuntos finitos. 

El teorema 14.1 nos dice que pueden asignarse probabilidades positivas a lo 
sumo a un subconjunto numerable de S. Los restantes puntos de S tendran proba- 
bilidad cero. En particular, si todos los resultados de S son igualmente probables, 
entonces todo punto de S debe tener asignada probabilidad cero. 

Observation: Puede darse una interpretation fisica del teorema 14.1 en fun- 
cion de la distribution de masa que ayuda a comprender su significado. Imagine- 
mos que disponemos de una cantidad de masa que totaliza 1. (Esto corresponde 
a P(S) = 1.) Supongamos que nos es posible distribuir esa masa del modo tjue 
queramos a lo largo del eje real, bien con espesor uniforme o variable, o bien 
colocando porciones discretas de masa en ciertos puntos, o de ambas maneras. 
(Interpretamos una cantidad positiva de masa como una porcidn discreta.) Podemos 
colocar toda la masa en un punto. Podemos dividir la masa en porciones discretas 
iguales o desiguales entre dos puntos, diez puntos, un milldn de puntos, o entre 
un conjunto no numerable de puntos. Por ejemplo, podemos poner | en 1, J en 2, 
| en 3, etcetera, poner masa (k) n en cada entero n > 1.0 podemos esparcir la 
masa sin ninguna portion concentrada. O podemos esparcir parte de ella y distri¬ 
buir el resto en porciones discretas. El teorema 14.1 nos dice que a lo mas po¬ 
demos asignar cantidades discretas de masa a un conjunto numerable de puntos. 

Puesto que la mayor parte de (si no todas) las probabilidades puntuales para 
un espacio muestral no numerable sera cero, no basta conocer las probabilidades 
puntuales para calcular las probabilidades de sucesos arbitrarios. Se necesita mas 
information; la description es mejor utilizando dos conceptos nuevos, las varia¬ 
bles aleatorias y las funciones de distribucion, a las que nos vamos a referir segui- 
damente. Dichos conceptos permiten hacer uso del Calculo integral en muchos 
problemas con espacios muestrales no numerables. La integration sustituye a la 
sumacion en el Calculo de probabilidades. 

14.3 Variables aleatorias 

En muchos experimentos nos interesan numeros asociados a los resultados del 
experimento. Por ejemplo, n monedas se lanzan simultaneamente y preguntamos 
por el numero de caras. Un par de dados ruedan y nos interesa la suma de los 
puntos conseguidos. Se lanza una flecha hacia un bianco circular y queremos saber 
la distancia desde el punto en que cayo, al centra. Siempre que asociamos un 
numero real a cada resultado de un experimento estamos tratando con una fun- 
cion cuyo dominio es el conjunto de resultados posibles y cuyo recorrido es el 
conjunto de los numeros reales en cuestion. Una tal funcion se llama variable 
aleatoria. A continuation damos una definition formal de variable aleatoria: 
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definicion de variable aleatoria. Sea S un espacio muestral. Una fun- 
cion real definida en S se llama variable aleatoria unidimensional. Si los valores 
de la funcion son pares ordenados de numeros reales (esto es, vectores en E 2 ), la 
funcion es una variable aleatoria bidimensional. Mas general, una variable alea¬ 
toria n-dimensional es simplemente una funcion cuyo dominio es el espacio mues¬ 
tral dado S y cuyo recorrido es un coleccion de n-plas de numeros reales (vectores 
en E n ). 

Asi pues, una variable aleatoria no es mas que una funcion vectorial definida 
en un conjunto. La palabra «aleatoria» tan solo se usa para recordar que el con- 
junto en cuestion es un espacio muestral (*). 

A causa de la generalidad de la anterior definicion es posible tener distintas 
variables aleatorias asociadas a un mismo experimento. En cada caso particular el 
experimentador debe decidir cuales son las variables aleatorias que le interesan. 
Generalmente, procuramos trabajar con las variables aleatorias cuyas funciones 
reflejaii, con la maxima simplicidad posible, las propiedades de los resultados del 
experimento que son realmente esenciales. 

Notaciones. Ordinariamente se emplean para representar variables aleato¬ 
rias unidimensionales letras mayusculas tales como X, Y, Z. El resultado de un 
experimento se representa con la letra griega <■>. Asi que, X(«>) representa aquel 
numero real que en la variable aleatoria X esta asociado al resultado «>. 

A continuacion damos algunos ejemplos sencillos de variables aleatorias. 

ejemplo 1. Un experimento consiste en echar un dado y leer el numero de 
puntos conseguido. La variable aleatoria mas «natural» a considerar es el numero 
grabado por el fabricante en el dado, a saber: 

X(a>) = a> para to = 1,2, 3,4, 5,6. 

Si estamos interesados en si el numero de puntos es par o impar, debemos consi¬ 
derar otra variable aleatoria Y, definida como sigue: 

Y(co) = 0 si co es par, 

Y(a>) = 1 si co es impar. 


(*) La expresion «variable estocastica» se usa tambien como sinonimo de «variable| 
aleatoria». La palabra «estocastica» procede de una rai'z griega que significa «suerte» y segun 
parece fue inventada por fakob Bernoulli y se usa frecuentemente en la literatura de la 
teoria de probabilidades. 
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Los valores 0 y 1 no son esenciales —podria utilizarse cualquier par de numeros 
reales distintos. No obstante, 0 y 1 sugieren «par» o «impar», respectivamente, 
porque representan el resto que se obtiene al dividir el resultado « por 2. 

ejemplo 2. Se lanza una flecha hacia un bianco circular. El conjunto de 
todos los resultados posibles es el de todos los puntos <o del bianco. Si imaginamos 
un sistema de coordenadas colocado en el bianco con el origen en su centro, pode- 
mos asignar diversas variables aleatorias a este experimento. Una de ellas es la 
variable bidimensional que asigna al punto m sus coordenadas rectangulares (x, y). 
Otra es el par de coordenadas polares (r, 0) del punto *>. Como ejemplos de varia¬ 
bles unidimensionales son aquellas que asignan a cada <o una de sus coordenadas, 
tales como la x o la r. En un experimento de este tipo deseamos a menudo conocer 
la probabilidad de que la flecha toque en una determinada region del bianco, por 
ejemplo, el primer cuadrante. Este suceso se puede describir de la manera mas 
simple mediante la variable aleatoria que asigna a cada punto «> su coordenada 
polar 0, asi que X(<») = 0; el suceso «la flecha da en el primer cuadrante» es el 
conjunto de valores de o> tales que 0 ^ X(«>) y 27r . 

Notaciones. Evitamos la notacion engorrosa empleando notaciones breves 
para describir ciertos tipos de sucesos y sus probabilidades. Por ejemplo, si t es un 
numero real, el conjunto de todos los <o del espacio muestral tales que X(o>) = t se 
representa brevemente poniendo 


X= t. 

La probabilidad de ese suceso se nota P(X = t) en lugar de poner P({<o\X(<») = f}). 
Los sfmbolos tales como P(X = a o X = b) y P(a < X ^ b) se definen de modo 
parecido. Asi pues, el suceso «X = a o X = b» es la reunion de los dos sucesos 
«X = a» y «X = b»; el simbolo P(X = a o X — b) representa la probabilidad 
de esa reunion. El suceso «a < X ^ b» es el conjunto de todos los puntos »> tales 
que X(a>) pertenece al intervalo semiabierto (a, 6], y el simbolo P(a < X ^ b) 
representa la probabilidad de ese suceso. 

14.4 Ejercicios 


1. Sea X una variable aleatoria unidimensional. 

a) Si a < b, demostrar que los dos sucesos a<X<byX<a son disjuntos. 

b) Determinar la reunion de los dos sucesos de la parte a). 

c) Demostrar que P(a < X < b) = P(X < b) — P(X < a). 

2. Sea ( X, Y) una variable aleatoria bidimensional definida sobre un espacio muestral S. 
Esto significa que (X, y) es una funcion que asigna a cada a de S un par de numeros 
reales (X(u), Y(u)). Naturalmente, cada X y cada Y es una variable aleatoria unidi¬ 
mensional definida en S. La notacion 


X <,a, Y <,b 
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represent.! cl conjunlo dc todos los clcmcntos w dc S talcs quc A'(u) < a y Y(o) < b. 

a) Si a < b y c < d, cxprcsar, cn funcion dc los clcmcntos dc S, el significado dc la 
siguientc notacion: a < X < b, c < Y < d. 

b) Dcmostrar quc los dos succsos «X < u, Y .< c» y «X < a, c < Y < d» son dis- 
junlos. Intcrprctar geometricamente esos succsos. 

c) Detcrminar la reunion dc los dos succsos del apartado b). 

d) Generalizar cl ejcrcicio 1 c) al caso bidimensional. 

3. Sc echan dos dados corrcctos, siendo cada rcsultado un par ordenado («, b), siendo 
a y b entcros del 1 al 6. Sea X la variable alcatoria quc asigna cl valor a + b al rcsul¬ 
tado (a, b). 

a) Dcscribir, cn la notacion cn lista, los succsos «X = 7», «X = 11», «X = 76 
X = U». 

b) Calcular las probabilidades dc los sucesos de la parte a). 

4. Considercmos un experimento cn el quc sc lanzan cuatro monedas simultaneamcnte 
(o una moneda se lanza cuatro veces). Para cada moneda defmimos una variable alca¬ 
toria que asigna el valor 1 a la c:;ra y el 0 a la cruz, y represenlemos esas variables 
aleatorias por Xi, X-j, Xx, A't, asignando las probabilidades P(,Xi — \) — P(X : = 0) = ‘A 
para cada Xi Considerar una nueva variable aleatoria Y que asigne a cada resultado 
el numero total de caras de las cuatro monedas. Expresar Y en funcion de 
Xi, X->, X.-j, X4 y calcular las probabilidades P(Y = 0), P(Y=1), y P(Y<1). 

5. Una pequena companta ferroviaria tiene medios para el transporte dc 100 pasajeros 
por dia entre dos ciudades, por un costc (para la compani'a) de 7 $ por pasajero. Si 
algun dia compran billetes mas de 100 pasajeros la compania esta obligada a propor- 
cionar transporte en autobus a los pasajeros que exceden por un coste de 10 S por 
persona. Sea X la variable aleatoria que representa el numero de pasajeros que com¬ 
pran billetes en un dia determinado. Los valores posibles de X son los entcros 
0, 1, 2, 3, ... hasta una cierto maximo desconocido. Si con Y representamos la variable 
aleatoria que expresa el coste total diario (en dolares) para la compafua por los pasajeros 
despachados, expresar Y en funcion de X. 

6. Una factoria de produccion en cadena consta de dos estaciones de trabaje A y B. 
En la estacion A, se montan X unidades por hora; inmediatamente son- transportadas a 
la estacion B, donde son inspeccionadas a razon de Y unidades por hora, siendo 
Y < X. Los posibles valores de X e Y son los enteros 8, 9 y 10. Si Z es la variable alea¬ 
toria que representa el numero de unidades que salen de la cadena en la primera hora 
de produccion: 

a) Expresar Z en funcion de X e Y, suponiendo cada X y cada Y constantes durante 
esta hora. 

b) Describir, de manera parecida, la variable aleatoria U que cucnta el numero de 
unidades producidas en las dos primeras horas. Cada una de las X e Y es constante 
durante cada hora, pero los valores constantes durante la segunda hora no deben 
necesariamente coincidir con los de la primera. 

14.5 Funciones de distribucion 

Volvemos de nuevo al problema del calculo de probabilidades de un suceso 
asociado a una cierta variable aleatoria. Sea X una variable aleatoria unidimensio¬ 
nal definida en un espacio muestral S, siendo S un conjunto de Borel en E n para 
n^l. Sea P una medida de probabilidad definida en los subconjuntos de Borel 
de S. Para cada <0 de S, X(cb) es un numero real, y cuando wrecorrelos elementos 
de S los numeros X(w) recorren un conjunto de numeros reales (el recorrido de X). 
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Este conjunto puede ser finito, infinito numerable, o no numerable. Para cada 
numero real t consideramos el siguiente subconjunto de S: 

A{t) = {<o\X{a>)< i t}. 

Si t es menor que todos los numeros del recorrido de X, el conjunto A(t) sera 
vado; de lo contrario, A(t) sera un subconjunto de S no vacfo. Suponemos que 
para cada t el conjunto Alt) es un suceso, esto es, un conjunto de Borel. De acuer- 
do con el convenio establecido al final de la section 14.3, representamos este 
suceso con el simbolo X ^ t. 

Suponemos conocida la probabilidad P(X — t) para todo t real. Este conoci- 
miento nos permitira calcular las probabilidades de otros muchos sucesos de 
interes. Para lograrlo se usan las probabilidades P(X =£ t) como base para la cons- 
truccion de una nueva funcion F, llamada funcion de distribution de X que se 
define de la manera siguiente: 

definici6n de funci6n de distribuci6n. Sea X una variable aleatoria uni¬ 
dimensional. La funcidn F definida para todo t real mediante la ecuation 


F'(t) = P(X < t) 

se llama la funcion de distribution de la variable aleatoria X. 


Observation. Algunas veces, la notation Fx se utiliza para resaltar el hecho 
de que la funcion de distribucion esta asociada a una cierta variable X. Entonces 
el valor de la funcion en t se escribe F x (t). 


Es importante darse cuenta de que la funcion de distribucion F esta definida 
sobre el eje real completo, aun cuando el recorrido de X puede ser una portion 
acotada del eje real. En efecto, si todos los numeros X(a>) estan en un cierto inter¬ 
val finito [a, ft], entonces para t < a la probabilidad P(X ^ t ) es cero (ya que 
para t < a el conjunto X ^ t es vacio) y para t^b la probabilidad P(X < t) 
es 1 (debido a que en este caso el conjunto X =£ t es el espacio muestral completo). 
Esto significa que para variables aleatorias X acotadas cuyo recorrido esta dentro 
de un intervalo {a, 6 ] tenemos F(t) = 0 para todo t < a y F(t) = 1 para todo 
t - b. 

Procederemos ahora a deducir un cierto numero de propiedades comunes a 
todas las funciones de distribucion. 


teorema 14.2. Si F es una funcion de distribucidn de una variable aleato¬ 
ria unidimensional X, entonces 

a ) 0 < F(t) < 1 para todo t. 

b) P{a < X < b) = F(b ) - F{a) si a<b. 

c) F(a) < F(b) si a < b. 
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Demostracion. La parte a) se deduce inmediatamente de la definition de 
F porque la probabilidad esta siempre comprendida entre 0 y 1. 

Para demostrar b) observemos que los sucesos «a < X ^ b» y «X — a» son 
disjuntos. Su reunion es el suceso «X ^ b». Aplicando la aditividad obtenemos 

P(a < X < b) + P(X ^ a) = P(X ^ b ), 

que tambien se puede poner en la forma 

P(a < X < b) — P(X <b)~ P(X < a) = F(b) - F(d). 

La parte c) se deduce de b) puesto que P(a < X ^ b) S; 0. 

Observation: Usando la analogfa de la masa, dirfamos que F(t) representa la 
cantidad total de masa situada entre -® y t (incluyendo el mismo punto t). La 
cantidad de masa localizada en el intervalo semiabierto (a, b ] es F(b) — F(a). 


F(t) F(t) 




Figura 14.1 Funcion de distribucidn de Figura 14.2 Funcion de distribucion de una 
una variable aleatoria acotada. variable aleatoria no acotada. 


La figura 14.1 nos muestra una funcion de distribucion de una variable alea¬ 
toria acotada X cuyos valores X(a>) estan en el intervalo [0, 1]. Este ejemplo es 
conocido como distribucidn uniforme. En el tenemos 


F(t) = 0 para t < 0, F(t) = t para 0 < t < 1, F(t ) = 1 para t > 1. 


En la figura 14.2 se ve un ejemplo de una funcion de distribucion correspon- 
diente a una variable aleatoria no acotada. Este ejemplo se conoce con el nombre 
de distribucidn de Cauchy y sus valores vienen dados por la formula 

F(t) = - + — arctan t. 

2 7T 
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Mas adelante veremos casos practicos que conducen a distribuciones uniformes 
y de Cauchy. 

Observacidn: Con el sfmil de la masa, diriamos que en la figura 14.1 no existe 
masa situada a la izquierda del origen o a la derecha del punto 1. Toda la masa ha 
sido distribuida en el intervalo [0,1]. La grafica de F es una recta sobre ese inter¬ 
val porque la masa esta extendida con densidad uniforme. En la figura 14.2 la masa 
esta distribuida a lo largo de todo el eje. La grafica no es lineal porque la masa esta 
extendida con densidad variable. 

El teorema 14.2 b) indica como calcular (en funcion de F) la probabilidad 
de que X este en un intervalo semi-abierto de la forma (a, bj. El teorema que 
sigue se refiere a otros tipos de intervalos. 

TEOREMA 14.3. Si F es una funcion de distribucidn de una variable alea- 
toria utti-dimensional X, entonces si a<b tenemos: 

a) P(a<X<b) = F(b) - F(a) + P(X = a). 

b) P{a < X < b) — F(b ) - F(a) - P(X = b). 

c) P(a < X < b) = F(b ) - F(a ) + P(X = a) - P(X = b). 

Demostracion. Para demostrar a) observemos que los sucesos «a < X ^ b» 

y «X = a» son disjuntos y su reunion es «a ^ X — b». Teniendo en cuenta la 
aditividad y el teorema 14.2 b) obtenemos a). Las partes b) y c) se demuestran en 
forma parecida. 

Observemos que los cuatro sucesos 
a < X < b, a < X <, b, a<X<b, y a^X<b 
tienen igual probabilidad si y solo si P(X = a) — 0 y P(X = b) = 0. 

Los ejemplos representados en las figuras 14.1 y 14.2 hacen ver otras dos 
propiedades que tienen todas las funciones de distribucidn, y que se describen en 
el teorema siguiente. 

teorema 14.4. Si F es la funcion de distribucidn de una variable aleatoria 
uni-dimensional X, entonces 

(14.1) lim F(t) = 0 y lim F(t) = 1. 

t~* — oo £-*+00 

Demostracidn. La existencia de los dos limites de (14.1) y el hecho de que 
los dos limites esten entre 0 y 1 se deduce al momento, puesto que F es una fun- 
cion monotona cuyos valores estan entre 0 y 1. 

Designemos los limites de (14.1) con L x y L 2 respectivamente. Para demos- 
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trar que Li = 0 y que L 2 — 1 emplearemos la propiedad de aditividad numerable 
de la probabilidad. A tal fin expresemos la totalidad del espacio S como una 
reunion numerable de sucesos disjuntos: 


S = U (—n < X <, - n + 1) U U(n < X < n + 1). 

w —1 71=0 


Entonces, por la aditividad, obtenemos 

P(S) = | P(—n < X < -n + l) +fp(n < X < n + 1) 

n=1 n~ 0 

M N 

= bm 2 [f(-« + 1) - F(-n)] + lim J [F(n + 1) - F(«)]. 

N-ao „to 

Las sumas del segundo miembro se simplifican unas con otras, dandonos 


P(S) = lim [F(0) - F(—M)] + lim [F(N + 1) - F(0)1 

M->cc AT-.® 

= F(0) - L, + L 2 - F(0) = L 2 - L x . 


Puesto que P(S) = 1, esto demuestra que L? — L x = l o sea L 2 = 1 + Lj. Por 
otra parte, tenemos tambien que L 2 ~ 1 y L x — 0. Esto implica que L 2 — 0 y 
Lj = 1, como se afirmo. 

14.6 Discontinuidades de las funciones de distribucion 

En la figura 14.3 se muestra un ejemplo de una posible funcion de distribu¬ 
cion con discontinuidades. Utilizando la analogia de masas diriamos que F tiene 
una discontinuidad de salto en cada punto que soporta una cantidad positiva de 
masa. El teorema que sigue muestra que el salto es igual a la cantidad de masa 
concentrada en el punto correspondiente. 



Figura 14.3 Una posible funcion de 
distribucion. 



Figura 14.4 Discontinuidad de salto 
de una funcion de distribucion. 
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teorema 14.5. Si F es una funcion de distribution de una variable aleatoria 
uni-dimensional X, entonces para cada valor real t tenemos 

(14.2) lim F(t) = F(a) 

t-*a+ 

y 

(14.3) lim F(t) = F(a) - P(X = a). 


Observation: La relation entre h'mites (14.2) nos dice que F es continua a 
la derecha de cada punto a, debido a que F(t) —> F(a ) cuando t —> a por la dere- 
cha. Por otra parte, ia ecuacion (14.3) nos dice que cuando t —> a por la izquierda, 
F(t) tiende hacia F(a) si y solo si la probabilidad P(X = a) es cero. Cuando 
P(X = a) no es cero, la grafica de F tiene una discontinuidad de salto en a del 
tipo de la que se ve en la figura 14.4. 

Demostracion. La existencia de los h'mites resulta inmediatamente de la mo¬ 
notonia y acotacion de F. Vamos a demostrar que los limites tienen los valores 
indicados. A tal 1 n utilizamos la parte b) del teorema 14.2. Si t > a escribimos: 


(14.4) p(t) = F(a) + P(a<X<t)- 
si t < a, ponemos 

(14.5) F{t) = F(a) -P{t <X< a). 

Haciendo t -» a+ en (14.4) encontramos 

limF(() = F{a) + lim P(a < X < t), 

t-*a+ £->a+ 

« 

mientras que si t -> a— en (14.5) obtenemos 

lim F(t) = F(a) - lim P(t < X < a). 

t-*a— t-*a— 

Por lo tanto para demostrar (14.2) y (14.3) debemos establecer dos igualdades: 

(14.6) lim P(a < X < t) — 0 

y 

(14.7) lim P(t < X <a) = P(X = a). 
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Intuitivamente pueden establecerse asi: Cuando t -» a+ , el intervalo semiabierto 
{a, t] tiende a confundirse con el conjunto vacfo. Esto es, la interseccion de todos 
los intervalos semiabiertos (a, t], para t > a, es vacia. Por otra parte, cuando 
t -» a — el intervalo semiabierto (f, a\ tiende a confundirse con el punto a. (La 
interseccion de todos los intervalos ( t, a] para t < a es el conjunto { a }.) Por con- 
siguiente, si la probabilidad se comporta de manera continua, las igualdades (14.6) 
y (14.7) deben ser ciertas. Para seguir este razonamiento en forma rigurosa vamos 
a hacerlo del siguiente modo: 

Para cada entero n > 1, sea 

(14.8) p n = p(a < X <a + ^j. 

Para demostrar (14.6) basta con demostrar que p„~* 0 cuando n -> °<>. Represen- 
tando con S„ el suceso 

a + — — < X ^ a + -. 
n + 1 n 

Los conjuntos S n son disjuntos y su reunion S, U Sj u S 3 u.es el suceso 

a < X ^ a + 1. Por la aditividad numerable tenemos: 


(14.9) 


oo 


ZP(S n ) = P(a <X<a + l) = pj. 


Por otra parte, la igualdad (14.8) implica que 

Pn Pn+1 P(S n ) , 


asf que de (14.9) obtenemos la relacion 


(14.10) 


00 


2 (Pn Pn+ 1) — Pi ■ 

n =1 


La convergencia de la serie es una consecuencia de (14.9). Pero la serie del primer 
miembro de (14.10) tiene por suma 


Pi ~ l* m Pn ■ 

n-+ oo 

Por lo tanto (14.10) implica que lfm„_ i00 p„ = 0, y esto prueba (14.6). 

Una ligera modificacion de este razonamiento nos permite demostrar tambien 
(14.7). Puesto que 


P{t < X < a) = P(t < X < a) + P(X = a) 




Discontinuidades de las funciones de distribution 


633 


tan solo necesitamos demostrar que j 

limP(t < X < a) = 0. 


A tal fin introducimos los numeros 


y demostramos que q n -> 0 cuando n -» °o. En este caso consideramos los sucesos 
T„ dados por 


para n = 1, 2,3,_Esos son disjuntos y su reunion es el suceso a — 1 < X < a, 

asi que tenemos 


2P(T„) = P(a - 1 < X < a) = q x . 

n=l 


Observemos ahora que q n - q „+1 = P(T n ), y poderaos completar la demostracion 
como antes. 


El tipo mas general de distribution es cualquier funcion real F con las pro- 
piedades siguientes: 

a) F es monotona creciente en el eje real. 

b) F es continua a la derecha de cada punto. 

c) lim F(t) = 0 y lim F(t) — 1 . 

t —►— 00 t ~►+£» 

En efecto, puede demostrarse que para cada una de esas funciones F existe 
una correspondiente funcion de conjunto P, definida sobre los conjuntos de Borel 
del eje real, tal que P es una medida de probabilidad que asigna la probabilidad 
F(b) — F(a) a cada intervalo semiabierto (a, b], Puede verse una demostracion de 
esto en H. Cramer, Mathematical Methods of Statistics, Princeton University Press, 
Princeton, N. J., 1946. 

Existen dos tipos especiales de distribuciones, llamadas discretas y continuas, 
que en la practica tienen particular importancia. En el caso discreto toda la masa 
esta concentrada en un numero de puntos finito o infinito numerable, mientras 
que en el continuo la masa esta esparcida, con espesor uniforme o variado, a lo 
largo de todo el eje real. En las proximas secciones se tratan con cierto detalle 
esos dos tipos de distribuciones. 
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14.7 Distribuciones discretas. Funciones de masa de probabilidad 

Sea X una variable aleatoria uni-dimensional y consideremos una nueva fun- 
cion p, llamada funcion de masa de probabilidad de X. Sus valores p(t) estan defi- 
nidos para todo numero real t medianle la ecuacion 


p(t) = P(X=t). 

Esto es, p(t) es la probabilidad de que X tome el valor t. Cuando deseemos poner 
de manifiesto que p esta asociado a X escribimos p x en lugar de p y p x (t) en 
lugar de p{t). 

El conjunto de numeros reales t para los cuales p{t) > 0 es finito o numera¬ 
ble. Lo expresamos por T; esto es, ponemos 

La variable aleatoria X se llama discreta si 

2 P (0 = 1 • 

teT 

Dicho de otro modo, X es discreta si una unidad de masa de probabilidad esta 
distribuida sobre el eje real concentrandose una masa positiva p(t) en cada punto 
t de un cierto conjunto T finito o infinite numerable y en los restantes puntos no 
hay masa. Los puntos de 7 se llaman puntos de masa de X . 

Para variables aleatorias discretas el conocimiento de la funcion de masa de 
probabilidad nos permite calcular la probabilidad de sucesos arbitrarios. Tene- 
mos, efectivamente, el siguiente teorema. 

teorema 14.6. Si A es un subconjunto de Borel de la recta real R, y si 
designamos con P(X e A) la probabilidad del conjunto de <« tal que X(o>) e A, 
entonces 

(14.11) P(XeA)= 2 P(x), 

xeA nT 

donde T es el conjunto de puntos de masa de X. 

Demostracidn. Puesto que A n T £ A y T — A c — A, 

(14 ' 12) *JnT P(X) ~ P(X * A) y I P {x)<P{X i A). 

xeT—A 
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Pero A n T y T — A son conjuntos disjuntos cuya reunion es T, asi que la se- 
gunda desigualdad de (14.12) es equivalente a 

1- 2 P(x) < 1 - P(X e A) o 2 Pix)^P(XeA). 

xeAnT xzAnT 

Combinando esto con la primera desigualdad (14.12) obtenemos (14.11). 

Observation: Pucsto que p(x) = 0 cuando x $ T, la suma del segundo miem- 
bro de (14.11) puede ponerse en la forma2re.4 p(x)sm peligro de confusion. 

Cuando A es el intervalo ( — °o, f], la suma de (14.11) da el valor de la 
funcion de distribucion F(t). Asi pues, tenemos 

F(t) = P(X <0 = 2 P(x) ■ 

X <t 

Si una variable aleatoria es discreta, la funcion de distribucion correspondiente F 
tambien es discreta. 

Los ejemplos que siguen de distribuciones discretas se presentan frecuente- 
mente en la practica. 

ejemplo 1. Distribucion binomial. Sea p un numero real que satisface la 
acotacion O^p^l ysea q = 1 — p. Supongamos una variable aleatoria que 
toma los valores 0, 1, 2, 3,... ,n, siendo n un entero positivo fijo, y admitamos 
que la probabilidad P(X = k) viene dada por la formula 



012345 012345 

a) La funcion masa. b) La funcion de distribucion. 


Figura 14.5 Las funciones de masa de probabilidad y de distribucidn de una variable 
aleatoria discreta con una infinidad numerable de puntos de masa n — 5 y p = J. 
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Esta asignacion de probabilidades es legitima porque la suma de todas ellas es: 

n n 

2 p (* = k) =2u)pv-*= (p + ?)-=i • 

k=0 k =0 ' ' 

La correspondiente funcion de distribucion Fx se denomina distribution binomial 
de parametros n y p. Sus valores pueden calcularse mediante la formula de su- 
macion 


Fx(t) = 2 (t)^ 

0<k<t ' ' 

La distribucion binomial se presenta de manera natural en el caso de una 
sucesion de pruebas de Bernoulli si p es la probabilidad de un suceso y q la del 
suceso contrario. Efectivamente, cuando la variable aleatoria X cuenta el nume- 
ro de veces que se presenta el suceso en n pruebas, P(X = k) es precisamente 
(k)p k q n ~ k en virtud de la formula de Bernoulli. (Vease el teorema 13.3 de la sec- 
cion 13.16.) La figura 14.5 muestra las graficas de la funcion de masa de proba¬ 
bilidad y la funcion de distribucion correspondiente para una distribucion bino¬ 
mial con parametros n = 5 y p = y 3 . 

ejemplo 2. Distribution de Poisson. Sean A un numero real positivo y X 
una variable aleatoria que toma los valores 0, 1, 2, 3,... . Si la probabilidad 
P(X = k) esta dada por la formula 


P(X = k) = 


e~ x k k 


k\ 


para k = 0,1, 2, ... , 


la funcion de distribucion correspondiente F x se llama distribution de Poisson de 
parametro A. Se denomina asi en honor del matematico frances S. D. Poisson 
(1781-1840). Esta asignacion de probabilidades es valida porque 

2p(x = k ) = = 1 • 

*=o t-o ^ ‘ 


Los valores de la funcion de distribucion se calculan con las sumas parciales 


Fx(t) = e~ x ^ 

0 <k<t 


k\ ‘ 


La distribucion de Poisson es aplicable a diversos problemas relativos a su- 
cesos aleatorios que se presentan en el transcurso del tiempo, tales como acciden- 
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tes de trafico, conexiones equivocadas en una central telefonica, e intercambios de 
cromosomas en las celulas provocados por rayos X. En los libros de Feller y 
Parzen, que al final del capftulo se citan, se discuten algunas aplicaciones par- 
ticulares. 

14.8 Ejercicios 

1. Se lanza un dado correcto. Como variable aleatoria X tomamos la funcion que cuenla 
el numero de puntos conseguidos con el dado. Dibujar la grafica de la correspondiente 
funcion de distribucion Fx. 

2. Se lanzan dos dados. Sea X la variable aleatoria que cuenta el total de puntos 
conseguidos. Construir una tabla que de los valores no nulos de la funcion de masa de 
probabilidad p x y dibujar la grafica de la funcion de distribucion F x . 

3. La funcion de distribucion F de una variable aleatoria X viene definida como sigue 

si t < -2, 
si -2 <, t <0, 
si 0 <j t < 2, 
si t >2. 



a) Dibujar la grafica de F. 

b) Describir la funcion de masa de probabilidad p y representarla. 

c) Calcular las siguientes probabilidades: ,P(X = 1), P(X < 1 ),P(X < 1), P{X = 2) 
P(X < 2) , P(0 < X < 2),P(0 < X < 2), P(l < X < 2). 

4. Considerese una variable aleatoria X cuyos posibles valores son todos los numeros ra- 

n n + 1 . 

cionales de la forma-y-siendo n= 1,2,3,... . Si 

n + 1 n 

comprobar que esta asignacion de probabilidades es correcta y disenar la forma de la 
grafica de la funcion de distribucion F x . 

5. La funcion de masa de probabilidad p de una variable aleatoria X es nula salvo en 
los puntos t = 0, 1, 2. En ellos toma los valores 


p(. 0) = 3c 3 , />(1) = 4c — 10c 2 , p(2) = 5c — 1, 

para un cierto c > 0. 

a) Determinar el valor c. 

b) Calcular las probabilidades: P(X < 1), P(X < 2),/ > (l < X <, 2),P(0 < X < 3). 

c) Describir y representar la funcion de distribucion F. 

d) Hallar el mayor valor de t tal que F(t) < |. 

e) Hallar el menor valor de t tal que F(t) > J. 
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6. Una variable aleatoria X tiene distribucidn binomial con parametros n = 4 y p = l 

a) Describir y representar la funcion de mas a de probabilidad p. 

b) Describir y representar la funcion de distribucidn F. 

c) Calcular las probabilidades P(1 < X < 2)y P(1 < X < 2). 

7. Supongamos que una chincheta se echa sobre la mesa, y cae o con la punta hacia 
arriba o en una posicion estable con la punta en la mesa. Supongamos que existe una 
probabilidad p de que quede con la punta hacia arriba. 

a) Supongamos que se echan en la mesa dos chinchetas identicas. Admitiendo la 
independencia estocastica, demostrar que la probabilidad de que ambas queden con 
la punta hacia arriba es p 2 . 

b) Continuando la parte a), sea X la variable aleatoria que cuenta el numero de 
chinchetas que quedan con la punta hacia arriba (los valores posibles de X son 0, 1 y 
2). Calcular las probabilidades P(X = 0) y P(X = 1). 

c) Representar la funcion de distribucidn F x cuando p = 

8. Dada una variable aleatoria X cuyos valores posibles son 1,2, ...,n. Admitamos que 
la probabilidad P(X = k) es proporcional a k. Determinar la constante de proporcio- 
nalidad, la funcion de masa de probabilidad p x , y la de distribucion F x . 

9. Dada una variable aleatoria X cuyos valores posibles son 0,1,2,3.Admitamos 

que P(X = k) es proporcional a c*/A!, donde c es un numero real fijo. Determinar la 
constante de proporcionalidad y la funcion de masa de probabilidad p. 

10. a) Se lanza un dado correcto. El espacio muestral es S ={1, 2, 3, 4, 5, 6}.Si el numero 
de puntos conseguidos es impar, un jugador recibe un dolar; en el caso contrario debe 
pagar un dolar. Sea X la variable aleatoria que mide el resultado (numero de dolares) 
en cada partida del juego. (Los valores posibles de X son +1 y -1). Describir y re¬ 
presentar las funciones de masa de probabilidad p x y de distribucion F x . 

b) Se lanza una moneda perfecta. El espacio muestral es S={H,T }(cara o cruz). 
Si el resultado es cara, un jugador recibe un dolar; si es cruz paga un dolar. Sea Y la 
variable aleatoria que mide el resultado (numero de dolares) en cada partida del juego. 
Demostrar que las funciones de masa de probabilidad p r y de distribucion F r son 
identicas a las de la parte a) de este ejercicio. Este ejemplo pone de manifiesto que 
variables aleatorias distintas pueden tener la misma funcion de distribucion dada F. 
(tPor que?) Se dice que tales variables aleatorias estan distribuidas identicamente. 
Cada teorema relativo a una funcion de distribucion particular es aplicable a cualquiera 
de las infinitas variables aleatorias que tengan esta distribucion. 

11. Se sabe que el numero de minutos que uno tiene que esperar un tren en cierta estacion 
del metro es una variable aleatoria X con la siguiente funcion de masa de probabilidad: 

/>(/) = 0 salvo para / = 3/c/10 si A: =0,1,2 .10. 

Pit) = iV si t = 0, 0.3, 0.6, 0.9, 2.1,2.4, 2.7, 3.0. 

Pit) - i si / = 1.2, 1.5,1.8. 

Representar la correspondiente funci6n de distribucion F. Sea A el suceso consistente 
en que uno tiene que esperar entre 0 y 2 minutos (incluyendo 0 y 2), y sea B el suceso 

tC "® r . ? U< L?, Spe n ar , Untr ® 1 y 3 minutos (incluyendo 1 y 3). Calcular las probabilida¬ 
des: P(A), P(B), P(A n B), P(B A), P(A U B). 

12. a) Si 0 < p < 1 y q = 1 _ p, demostrar que 
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siendo 



b) Dado X > 0, sea p = \/n para n > X. Demostrar que Q„ -» 1 cuando n <*> y que 



— e A cuando n -* co . 
k\ 


Este resullado sugiere que para n grande e y pequeno, la distribucion binomial es apro- 
ximadamente la misma que la de Poisson, con tal que el producto np sea casi cons- 
tante ; esta constante es el parametro X de la distribucion de Poisson. 


14.9 Distribuciones continuas. Funciones de densidad 

Sea X una variable aleatoria unidimensional y F su funcion de distribucion, 
de modo que F(f) = P(X ^ t) para todo t real. Si la probabilidad P(X = t) es 
cero para todo t, entonces, en virtud del teorema 14.5, F es continua en todo el 
eje real. En este caso F se llama distribucion continua y X es una variable alea¬ 
toria continua. Si existe la derivada F' y es continua en el intervalo [a, <] puede 
hacerse uso del segundo teorema fundamental del calculo y escribir: 

(14.13) F(t)- F(a) = j*J(u)du, 

siendo / la derivada de F. La diferencia F(t) — F(a) es, naturalmente, la probabi¬ 
lidad P(a < X ^ t), y la desigualdad (14.13) expresa esta probabilidad como una 
integral. 

En algunas ocasiones la funcion de distribucion F puede expresarse como una 
integral de la forma (14.13), en la que el integrando f es integrable pero no nece- 
sariamente continua. Siempre que una igualdad como la (14.13) es valida para 
todos los intervalos [a, f], el integrando / se llama funcion de densidad de pro¬ 
babilidad de la variable aleatoria X (o de la distribucion F) con tal que / sea no 
negativa. Dicho de otro modo, tenemos la siguiente definicion: 

definici6n de funcion de densidad de probabilidad. Sea X una variable 
aleatoria continua con funcion de distribucion F. Una funcidn f no negativa se 
denomina densidad de probabilidad de X (o de F ) si es integrable en todo el 
intervalo [a, t] y si 


(14.14) 


F(t) - F(a) = P/(“) du ■ 

*> a 
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Si en (14.14) hacemos que a , entonces F(a) —> 0 y obtenemos la 

importante formula 


(14.15) F(0 = P(X £*) = /' f(u)du, 

" —CO 

valida para todo t real. Si hacemos ahora t -» -f °° y recordamos que F(t) -> 1 
encontramos que 

r+oo 

(14.16) I /(«)</« = 1. 

»—OO 

Para las variables aleatorias discretas la suma de todas las probabilidades P(X = t ) 
es igual a 1. La formula (14.16) es la version de la misma propiedad adaptada a 
variables aleatorias continuas. Tambien existe una estrecha analogia entre las for¬ 
mulas (14.11) y (14.15). La funcion densidad / desempena, para las distribuciones 
continuas, el mismo papel que la funcion de masa de probabilidad p para distri¬ 
buciones discretas; la integration reemplaza la suma en el calculo de las proba¬ 
bilidades. Existe una diferencia importante, sin embargo. En el caso discreto p(t) 
es la probabilidad de que X = t, pero en el continuo f(t) no es la probabilidad de 
que ( X = t). En efecto, esta probabilidad es cero debido a que F es continua 
para todo t, lo que equivale a que para una distribucion continua es; 

P{a < X < b) = P(a < X < b) — P(a < X <, b) = P(a < X <b). 

Si F tiene una densidad f cada una de esas probabilidades es igual a la integral 
S b a f(u)du. 


Observation: Una distribucion dada puede tener mas de una densidad puesto 
que el valor del integrando de (14.14) puede modificarse en un numero finito de 
puntos sin que por ello varie la integral. Pero si / es continua en t entonces 
/(f) = F'(t); en este caso el valor de la funcion densidad en t esta determinado con 
unicidad por F. 

Como f es no negativa, se puede interpretar geometricamente la ecuacion 
(14.14) como el area del conjunto de ordenadas de / situadas a la izquierda de la 
recta x = t. El area de todo el conjunto de ordenadas es igual a 1. El area de 
la parte del conjunto de ordenadas situada encima de un intervalo dado (sea abierto, 
cerrado o semiabierto) es la probabilidad de que la variable aleatoria X tome un 
valor en tal intervalo. La figura 14.6 muestra un ejemplo de una funcion F de dis¬ 
tribucion continua y de su funcion de densidad /. La ordenada F(t) en la figura 
14.6 a) es igual al area de la region sombreada en la figura 14.6 b). 

En las secciones que siguen vamos a ver algunos ejemplos importantes de dis¬ 
tribuciones continuas. 
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14.10 Distribucion uniforme sobre un intervalo 


Se dice que una variable aleatoria uni-dimensional X tiene una funcion de 
distribucion uniforme F sobre un intervalo finito [a, b] si F viene dada por las 
formulas siguientes: 



si t < a , 

si a < t < b 

si t > b. 



nn i /(/> 

1 

a) 


LcRmMSB 



nn i) — 
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r ■ ’ - mBm 



a 1 

h 



a) Funcion de distribucion F. b) Funcion de densidad /. 

Figura 14.6 Una funcion de dist ibucion uniforme sobre un intervalo [ a,b ] y la 
correspondi nte funcion. de densidad. 


£sta es una distribucion continua cuva grafica es la de la figura 14.6 a). 

La derivada F'(i) existe para todo valor de t excepto en los puntos a y b, y 
podemos escribir 


F(t) = j[j(M)du, 


en donde / es la funcion de densidad, definida como sigue: 


Rt) = 


m - a) 
0 


si a < t < b, 
para los demas valores de t 


La grafica de / esta representada en la figura 14.6 b). 

El teorema que sigue caracteriza las funciones de distribucion de otro modo. 

teorema 14.7. Sea X una variable aleatoria uni-dimensional con todos sus 
valores en un intervalo finito \_a, b], y sea F la funcion de distribucidn de X. La 
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funcion F es uniforme sobre [a, b ] si y solo si 
(14.17) ?(Je/) = ?(Je7) 

para todo par de subintervalos I y J de [a, 6 ] que tengan la misma longitud, en 
cuyo caso tenemos 

P(X £ /) — —— , 

b — a 

en donde h es la longitud de 1 .1 

Demostracion. Supongamos primero que X tiene una funcion de distribu¬ 
tion sobre [a, b]. Si [c, c + h] es un subintervalo cualquiera de [a, b ] de lon¬ 
gitud h tenemos 


P(c £ X < c + h) = F(c + h) - F(c) = = —L . . 

b — a b — a b — a 

Esto demuestra que P(X e I) = P(X eJ) = h/(b - a) para todo par de subin¬ 

tervalos / y / de [a, 6 ] de longitud h. 

Para demostrar el reciproco, supongamos que X satisface (14.17). Observe- 
mos primero que F(t) = 0 si t < a y F(t) = 1 si t > b, ya que X tiene todos sus 
valores en [a, b], 

Introduzcamos una nueva funcion g definida en el intervalo semi abierto 
( 0 , b — a] mediante la ecuacion 

g(u) = P(a < X <, a + u) si 0 <u <, b - a. 

Aplicando la aditividad y la propiedad (14.17) encontramos 

g(u + v) = P(a < X < a + u + v) 

= P(a < X <, a + u) + P(a + u<X< t a + u + v) 

— g ( u ) + P{a < X <. a -f 5 )= g(u) + g(v), 
con tal que 0 <u + v^b — a. Esto es, g satisface la ecuacion funcional 
(14.18) g(u + v) = g(u) -(- g(v) 

para todas las funciones u y v tales que u > 0, v > 0, u + v ^ b - a. Esta es 
la llamada ecuacidn funcional de Cauchy. Demostraremos en breve que toda solu- 
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cion no negativa de la ecuacidn funcional de Cauchy viene dada por 

g(u) = —-— g(b — a ) para 0 < u <, b — a. 

b — a 

Aplicando esto en la ecuacidn (14.18) encontramos que para 0 < u ^ b — a te- 
nemos 

P(a < X £ a + u) = P(a < X <, b) — 

b — a b — a 

ya que P{a < X b) = 1. Es decir, 

F(a + u) — F(a) = —-— si 0 < u <, b — a. 

b — a 

Pongamos t — a + u y esta ultima igualdad se puede escribir en la forma 

F(t) — F(a) = --- si a <t <>b. 

b — a 

Pero F(a) = 0 ya que F es continua por la derecha. Luego 

F(t) = ^-- si a <,t <,b, 

b — a 

lo que demuestra que F es uniforme en [a, b]. 

TEOREMA 14.8. SOLUCION DE LA ECUACldN FUNCIONAL DE CAUCHY. Si g 
es una funcion de valores reales definida en un intervalo semiabierto (0, c] y que 
satisface las propiedades siguientes 

a) g(u + v) = g(u) + g(v) siempre que u, v y u + v pertenezcan a (0, c]. 

b) g es no negativa en (0, c]. 

Ehtonces g viene dada por la formula 

g(u) = - g(c) para 0 < u ^ c. 
c 

Demostracion. Introduciendo un cambio de escala podemos reducir la de- 
mostracion al caso particular en el que c = 1. En efecto, pongamos 

G(x) = g(cx ) para 0 < x <; 1. 
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Entonces G es no negativa y satisface la ecuacion funcional de Cauchy 

G(x + y) — G(x) + G(y ) 

siempre que x, y, y x + y pertenezcan a (0, 1]. Si demostramos que 

(14.19) G(x) = xG(l) para 0 < x <, 1 

resulta que g(cx) = xg(c), o que g(u) = ( u/c)g(c ) para 0 < u ^ c. 

Si x esta en (0, 1] entonces x/2 tambien pertenece a (0, 1] y tenemos 

0W = G (i) + c (i) = 2G (i)- 

Por induccion, para cada x de (0,1] tenemos 


(14.20) 


G(x) = nG 1-1 para n = 1, 2, 3,. .. . 


Del mismo modo, si y y my estan en (0, 1 ] tenemos 

G(my) — mG{y) para m= 1,2,3,.... 

Haciendo y = x/n y aplicando (14.20) obtenemos 

= — G(x) 

\n 1 n 

si x y mx/n estan en (0, 1], Dicho de otro modo, tenemos 
(14.21) G(rx) = rG(x) 

para todo numero racional positivo r tal que x y rx esten en (0, 1]. 

Tomemos ahora un x cualquiera en el intervalo abierto (0, 1) y sean {/*„} 
y {K„} de dos sucesiones numerosl racionales del intervalo (0, 1] tales que 


r n < x < R n y q Ue lj m = lim R n = x. 

n-*co n-> oo 

La ecuacion funcional de Cauchy y la propiedad de ser G no negativa demuestran 
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que G(x + y) - G(x) asf que G es monotona creciente en (0, 1]. Por consiguiente 

G(r n ) < G(x) <, G(R„). 

Aplicando (14.21) podemos poner esto en la forma 

r n G( 1) ^ G(x) < R„G(l). 

Haciendo que n -» oo encontramos xG( 1) - G(x) ^ x G(l), con lo que G(x) = 
xG( 1), lo cual demuestra (14.19). 

Observation: Las distribuciones uniformes se utilizan a menudo en experi- 
mentos cuyos resultados son puntos seleccionados al azar en un intervalo [a-, b], 
o en experimentos que se refieren a un intervalo [a, b] como un bianco, en el que 
es imposible hacer punteria. Los terminos «al azar» e «imposible hacer punteri'a» 
se interpretan ordinariamente para significar que si I es un subintervalo cualquiera 
de [a, b] entonces la probabilidad P(X £ /) depende solamente de la longitud de 
/ y no de su position en [a, b], El teorema 14.7 demuestra que las distribuciones 
uniformes son las unicas distribuciones que tienen esa propiedad. 

Volvamos ahora a las cuestiones de probabilidad formuladas al comienzo de 
este capltulo. 

ejemplo. Un segmento rectilineo se descompone en dos partes, eligiendo el 
punto de subdivision al azar. Designemos con X la variable aleatoria que mide 
la razon de la longitud de la parte izquierda a la de la parte derecha. Determinar . 
la funcion de distribucion de probabilidad Fx. 

Solution. Utilicemos el intervalo [0, 1] para representar el segmento rectilf- 
neo y expresemos el punto de subdivision mediante la variable aleatoria Y(o>) = <o 
para cada <o en (0, 1). Ya que el punto de subdivision se elige al azar supongamos 
que Y tiene una funcion de distribucidn uniforme F y sobre [0, 1]. Luego 

Fy(t) = t para 0 ^ t < 1 . 

Si el segmento se parte en <o, entonces <o/(l — a>) es la razon de la longitud 
de la parte izquierda a la de la parte derecha. Por tanto X(o>) — m/(l — o). 

Si t < 0 tenemos F x (t) = 0 ya que la razon X(a>) no puede ser negativa. Si 
t ^ 0, la desigualdad X(a>) ^ t es equivalente a «/(l — w) ^ t, la cual equivale a 
a ^ t/( 1 + t). Por consiguiente 

™ s 0 - P { Y s tt) - fi -(rr<) - rr. 


puesto que 0 t/(l + t) < 1. 
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Ahora podemos calcular diversas probabilidades. Por ejemplo, la probabili- 
dad de que las dos partes tengan la misma longitud es P(X — 1) = 0. En efecto, 
puesto que F x es una distribucion continua, la probabilidad de que X tome un 
valor particular cualquiera es cero. 

La probabilidad de que el segmento de la izquierda sea por lo menos de lon¬ 
gitud doble que el de la derecha es P(X 2 : 2) = 1 — P(X < 2) = 1 — % = y 3 . 
Analogamente, la probabilidad de que el segmento de la derecha sea por lo me¬ 
nos de longitud doble que el de la izquierda es P(X =£ y 2 ) = %. La probabilidad 
de que la longitud del segmento total sea por lo menos de longitud doble que la 
de la parte menor es P(X 2: 2) + P(X ^ y 2 ) = %. 

14.11 Distribucion de Cauchy 

Se dice que una variable aleatoria X tiene una distribucion de Cauchy F si 

F(t) = - + — arctan t 

2 7T 


/(') m 



a) Funcion de distribucion F. b) Funcidn de densidad /. 

Figura 14.7 Funcidn de distribucion de Cauchy y la correspondiente funcidn de densidad. 

para todo t real. Esta funcion tiene derivada continua para todo valor de P, la 
correspondiente funcion de densidad / viene dada por la formula 


/«) = 


1 

vr(l + l 2 ) 


Las graficas de / y F son las de las figuras 14.7 b) y a), respectivamente. 

El experimento siguiente nos conduce a una distribucion de Cauchy. A una agu- 
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ja que puede girar alrededor del punto (— 1, 0) del eje x se la impulsa para que 
gire y se la deja parar espontaneamente. Un resultado del experimento es el an- 
gulo 9 que forma la aguja con el eje x; 9 se mide de modo que — \ir < 9 <, ^tt. 
Razonando de manera parecida a como se ha hecho en el ejemplo 1 se demuestra 
que la variable aleatoria X definida por X(9) = 6 tiene una distribution uniforme 
sobre el infervalo [—\tt,\tt], con densidad f x (t) = i si — |tt < / < \tt . 
Consideremos ahora la variable aleatoria Y definida por 

Y{0) = tanfl. 

Demostraremos ahora que Y tiene una distribucion de Cauchy Fy si X tiene 
distribucion uniforme sobre [ — %ir, 1 / 2 tt']. 

Si a < t sea a = arc tan a y 9 = arc tan t. Tenemos entonces, 

F r (t) - Fy(a) = P(a <Y < t) = F(« < X ^ 0) = Cf x (u) du = . 

Joe 7 T 

Ya que a -> — ~/2 cuando a -> — °° encontramos: 

.. , 0 + TT 1 1 

/■,.(/) = -— = - arctan t + - . 

TT TT 2 

Esto nos demuestra que Y tiene una distribucion de Cauchy. 


14.12 Ejercicios 

1. Una variable aleatoria X tiene funcion de distribucion continua F, siendo 

si t <, 0, 
si 0 <, t <, 1, 
si / > 1. 

a) Determinar la constante c y describir la funcion densidad f. 

b) Calcular las probabilidades P{X = ^),P(X <J),P(|Y| < J). 

2. Sea /(/) = c |sen tj para jt| < tt/2 y /(<) = 0 para los demds valores de t. Determinar 
el valor de la constante c de manera que / sea la densidad de una funcion de distribu- 
cion continua F. Describir, tambien, F y representarla. 

3. Resolver el ejercicio 2 si /(t) = c(4t — 2/ 2 ) para 0 < t < 2, y }(t) = 0 para los demas 
valores de t. 

4. El tiempo en minutos que una persona espera un autobus es una variable aleatoria con 
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funcion de densidad / dada por las formulas siguientes: 


/(') = 2 Para 0 < t < 1, /(/*) = J para 2 < t < 4, /(/) = 0 para los demas 

valores de t. 

Calcular la probabilidad de que el tiempo de espera sea a) mayor que un minuto; 
b) mayor que dos minutos; c) mayor que tres minutos. 

5. Una variable aleatoria X tiene una funcion de distribucion continua F y una densidad 
de probabilidad f. La densidad tiene las propiedades siguientes: f(t) = 0 si t < J, 
/(i) = 1 ,/0)es lineal si J < t <, £, /(I - t) = j(t) para todo t. 

a) Representar f. 

b) Dar un conjunto de formulas que determinan F y representarla. 

c) Calcular las probabilidades: P(X<1), P(X<§),P(X<§), P(X< \),P( |<X<f). 

6. Una variable aleatoria X tiene una distribucion uniforme sobre [-3,3], 

a) Calcular P(X = 2), P(X < 2), P(|X| < 2), P(|X - 2| < 2). 

b) Hallar un valor de t para el que P(X > /) =J. 

7. La Compania Lethe Subway tiene senalado un tren en direccion norte cada 30 minutos 
en cierta estacion. Sea X la variable aleatoria que cuenta el numero de minutos que un 
hombre, que entro en la estacion en un tiempo aleatorio, debe esperar el proximo tren. 
Supongamos que X tiene una distribucion uniforme en el intervalo [0,30], (Este es el 
sentido que debemos atribuir a la frase, el senor entra en la estacion en un «tiempo 
aleatorio».) 

a) Para cada k = 5, 10, 15, 20, 25, 30, calcular la probabilidad que tiene de esperar 
por lo menos k minutos para el prdximo tren. 

b) Una compania competidora, la Styx Subway, esta autorizada para anunciar un tren 
cada 30 minutos en direccion norte, en la misma estacion, pero las llegadas de dos 
trenes de distinta compania deben diferir por lo menos 5 minutos. Supongamos que los 
viajeros entran en la estacion en tiempos aleatorios y siempre toman el primer tren 
que llega. Demostrar que la compania Styx puede combinar su horario de manera que 
recoja hasta cinco veces el numero de viajeros que su competidora. 

8. Sea X una variable aleatoria con una distribucion uniforme F x sobre el intervalo 
[0,1], Pongamos Y = aX + b, donde a > 0. Determinar la funcion de distribucion 
F r y dibujar su grafica. 

9. Una ruleta recorre los enteros de 0 a 36, distribuidos en 37 arcos iguales. Se pone en 
marcha la ruleta y se la deja parar libremente, y se anota el punto de la circunferencia 
junto al cual se para. Considerese este punto de parada como una variable aleatoria X 
con una distribucion uniforme. Calcular la probabilidad de que X este en un arco que 
contenga a) el entero 0; b) un entero n en el intervalo 11 < n < 20; c) un entero impar. 

10. Se dice que una variable aleatoria tiene una distribucion de Cauchy con parametros 
a y b, siendo a > 0, si su funcion de densidad viene dada por 


J it a 2 + (r - b) 2 ' 

Comprobar que la integral de / entre — =*> y + oo es 1, y determinar la funcion de 
distribucion F. 

11. Sea fi(t) = 1 para 0 < t < 1, y /i(Z) = 0 para los demas valores de t. Definamos una 
sucesion funcional {/,} mediante la formula recurrente 

1 (* - t)fn(t)dt. 
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a) Demostrar que f n+ 1 (*) = S^-i/n(0dt. 

b) Esbozar las graficas de ft, fo y f 3 . 

12. Respecto al ejercicio 11. Demostrar que cada funcion /„ es una densidad de probabilidad. 


14.13 Distribuciones exponenciales 

Sea A una constante positiva. Se dice que una variable aleatoria uni-dimen¬ 
sional X tiene una funcion de distribucion exponencial F con parametro A si 


m = 


fl - e~ u 

0 


para t >' 0, 
para t < 0. 


La funcion densidad / correspondiente viene dada por las formulas 


[Xe Xl para t > 0, 

m =! 

(0 para / < 0. 

Las graficas de F y / son parecidas a las de la figura 14.8. 

Las distribuciones exponenciales tienen una propiedad caracten'stica que su- 
giere su aplicacion en ciertos problemas relativos a desintegracion radiactiva, 
accidentes de trafico, y averias en aparatos de equipos electronicos tales como 
tubos de vacfo. Esta propiedad es analoga a la que caracteriza las distribuciones 
uniformes y puede describirse del siguiente modo. 


HD 



m 



Figra 14.8 Distribution exponential y funcion de densidad correspondiente. 
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Designemos con X el tiempo transcurrido hasta que una pieza del equipo 
falla, y sea F la funcion de distribucion de X. Supongamos que F(0 = 0 para 
f < 0, y por el momento no imponemos otras restricciones a F. Si t > 0, entonces 
X ^ t es el suceso «el fallo sucede en el intervalo [0, f]». Luego X > t es el 
suceso complementario, «ningun fallo ocurre en el intervalo [0, t]». 

Supongamos que no se presenta fallo en el intervalo [0, f]. ^Cual es la proba- 
bilidad de supervivencia, es decir de que no haya fallo en el intervalo [t, t + s]? 
Esta es una cuestion de probabilidades condicionadas. Queremos determinar 
P(X > t + s\X > t), la probabilidad condicionada de que no exista fallo en el 
intervalo [0, t + s], dado que no haya existido en el intervalo [0, /]. 

Segun la definicion de probabilidad condicionada tenemos 


P(X > t + s | X > 0 = 
(14.22) 


P[(X >t + s)n(X>t)] 
P(X > t) 


P(x>t + s ) 
P(X > t) 


Supongamos ahora que F es una distribucion exponencial con parametro 
X > 0. Entonces F(t) = 1 — e~ u para t > 0, y P(X >0=1— P(X - t) = e~ M . 
Luego la ecuacion (14.22) se transforma en 


p -M+s) 

P(X>t + s\X>t) = = P(X > s). 

Dicho de otro modo, si el organo o pieza del equipo sobrevive en el intervalo 
[0, t], la probabilidad de que continue sobreviviendo en el intervalo [t, t + s] 
es igual a la probabilidad de supervivencia en el intervalo [0, s] de la misma 
longitud. Esto es, la probabilidad de supervivencia depende tan solo de la ampli- 
tud del intervalo de tiempo y no de la edad del aparato. Expresado con la funcion 
de distribucion F, esta propiedad establece que 


(14.23) 


1 - F(t + s) 
1 - F(t) 


1 - F(s) 

para todo t > 0 y todo s > 0. 


El teorema que sigue demuestra que las distribuciones exponenciales son las 
unicas distribuciones de probabilidad con esa propiedad. 

teorema 14.9. Si F es una funcion de distribucion de probabilidad que 
satisface la ecuacion funcional (14.23), siendo F{t)< 1 para t>0, existe entonces 
una constante positiva A>0 tal que 

* - F(t) — 1 — e~ xt para todo t > 0. 
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Demostracion. Sea g(/)=-log [1 — F(t)] para t> 0. Entonces 1 -F(t) = 
e~ em , asi que para demostrar el teorema es suficiente probar que g(t) = M para 
un cierto A > 0. 

Ahora bien g es no negativa y satisface la ecuacion funcional de Cauchy 

g (t + s ) = g( t ) + g(s) 

para todo t > 0 y todo s > 0. Por consiguiente, aplicando el teorema 14.8 con 
c = 1, deducimos que g(f) = tg(l) para 0 < t ^ 1. Pongamos A — g(l). Enton¬ 
ces A = — log [1 — F(l)j > 0, y por tanto g(t) = A t para 0 < t ^ 1. 

Para demostrar que g(t) = A t para todo t > 0, pongamos G(t) = g(t)-~ At. 
La funcion G tambien satisface la ecuacion funcional de Cauchy. Ademas, G es 
periodica con perfodo 1 debido a que G(t + 1) = G(t) + G(l) y G(l) = 0. 
Puesto que G es identicamente 0 en (0, 1] la periodicidad demuestra que 
G (t) = 0, para todo t > 0. Es decir, g(t) = A t para todo f > 0, lo cual completa 
la demostracion. 

ejemplo 1. Sea X una variable aleatoria que mide el tiempo de vida (en 
horas) de un cierto tipo de tubo de vacio. Supongamos que X tenga una distribu- 
cion exponencial con parametro A = 0,001. El fabricante desea garantizar esos tu- 
bos para una duracion de T horas. Determinar T de modo que P{X > T) — 0,95. 

Solution. La funcion de distribucion viene dada por F(t) = 1 — e~ xl para 
t > 0, en donde A = 0,001. Puesto que P(X > T) = 1 — F(T) = e~ XT , elegimos 
T para que <T xr =0,95. Luego T=-(log 0,95)/A= -1 000 log 0,95 = 51,25 + . 

ejemplo 2. Consideremos la variable aleatoria del ejemplo 1, pero con un 
valor de A no especificado. El razonamiento que sigue sugiere un procedimiento 
razonable para determinar A. Empezamos con un numero inicial de tubos de vacio 
en el tiempo t = 0, y designemos con g(t) el numero de tubos que aun funcionan 
al cabo de t horas. La razon [g(0) — g(0]/g(0) es la fraccion del numero original 
que ha fallado en el tiempo t. Puesto que la probabilidad de que un tubo falle en 
el tiempo t es 1 — e~ xt , parece razonable esperar que la ecuacion 

(14.24) g(°) ~ g(0 = x _ e -u 

g(0) 

sea una buena aproximacion de la realidad. Si suponemos (14.24) obtenemos 

g( 0 = g( 0)e- xt . 


Es decir, en las hipotesis (14.24), el numero g(t) obedece a una ley de deterioro 



652 


Calculo de probabilidades 


exponencial con deterioro constante A. El deterioro constante puede calcularse en 
funcion de la vida media. Si t x es la vida media entonces \ — g(ti)/g(0) = e~ xtl , 
asi que A = (log 2)//,. Por ejemplo, si se sabe que la vida media de una gran 
muestra de tubos es 693 horas, obtenemos A = (log 2)/693 = 0,001. 

14.14 Distribuciones normales 

Sean my u dos numeros reales fijos, siendo a > 0. Se dice que una variable 
aleatoria X tiene distribution normal de media m y varianza si la funcion de 
densidad es 


f{t) = —4= e -i^)hfn 
ay/ 2n 

para todo t real. La funcion de distribucion correspondiente F es, naturalmente, 
la integral 


Fit) 


= -Lf 

ay/2n t 


g -[(«- m )/ ff ] 2 /2 du _ 


4 >(/) 




Figura 14.9 Funcion de distribucion normal Figura 14.10 Funcion densidad de una dis- 
canonica: m = 0, a — 1. tribucion normal de media m y varianza a 2 . 


Es evidente que esta funcion F es monotona creciente y continua en todo el eje 
real, y que tiende a cero cuando t—* — °e. Tambien se puede demostrar que 
F(t) —> 1 cuando f-> + 00 . (Vease ejercicio 7 de la seccion 14.16.) 

El caso particular m = 0, a = 1 es la distribucion normal canonica. En tal 
caso la funcion F se representa ordinariamente con la letra 4>. Asi pues, 

<p(0 = —L f e-“ 2/2 du . 

V Irr 





Tabla 14.1 Valores de la funcidn de distribution normal candnica. 


m 



e u ‘ /2 du. 


t 

0,00 

0,01 

0,02 

0,03 

0,04 

0,05 

0,06 

0,07 

0,08 

0,09 

0,0 

0,5000 

0,5040 

0,5080 

0,5120 

0,5160 

0,5199 

0,5239 

0,5279 

0,5319 

03359 

0,1 

0,5398 

0,5438 

0,5478 

0,5517 

0,5557 

0,5596 

03636 

0,5675 

03714 

0,5753 

0,2 

0,5793 

0,5832 

0,5871 

0,5910 

0,5948 

0,5987 

0,6026 

0,6064 

0,6103 

0,6141 

0,3 

0,6179 

0.6217 

0,6255 

0,6293 

0,6331 

0,6368 

0,6406 

0,6443 

0,6480 

0,6517 

0,4 

0,6554 

0,6591 

0,6628 

0,6664 

0,6700 

0,6736 

0,6772 

0 6808 

0,6844 

0,6879 

0,5 

0,6915 

0,6950 

0,6985 

0,7019 

0,7054 

0,7088 

0,7123 

0,7157 

0,7190 

0,7224 

0,6 

0,7257 

0,7291 

0,7324 

0,7357 

0,7389 

0,7422 

0,7454 

0,7486 

0,7517 

0,7549 

0.7 

0,7580 

0,7611 

0,7642 

0,7673 

0,7704 

0,7734 

0,7764 

0,7794 

ft 7823 

0,7852 

0,8 

0,7881 

0,7910 

0,7939 

0,7967 

0,7995 

0,8023 

0,8051 

0,8078 

0,8106 

0,8133 

0,9 

0,8159 

0,8186 

0,8212 

0,8238 

0,8264 

0,8289 

0,8315 

0,8340 

0,8365 

0,8389 

1,0 

0,8413 

0,8438 

0,8461 

0,8485 

0,8508 

0,8531 

0,8554 

0,8577 

0,8599 

0,8621 

1.1 

0,8643 

0,8665 

0.8686 

0,8708 

0,8729 

0,8749 

0,8770 

0,8790 

0,8810 

0,8830 

1.2 

0,8849 

0,8869 

0,8888 

0,8907 

0,8925 

0,8944 

0,8962 

0,8980 

03997 

0,9015 

1.3 

0,9032 

0,9049 

0,9066 

0,9082 

0,9099 

0,9115 

0,9131 

0,9147 

00162 

0,9177 

1,4 

0,9192 

0,9207 

0,9222 

0,9236 

0,9251 

0,9265 

0,9279 

0,9292 

0,9306 

0,9319 

1,5 

0,9332 

0,9345 

0,9357 

0,9370 

0,9382 

0,9394 

0,9406 

0,9418 

0.9429 

0,9441 

1,6 

0,9452 

0-9463 

0,9474 

0,9484 

0,9495 

0,9505 

0,9515 

0,9525 

0,9535 

0,9545 

1,7 

0,9554 

0,9564 

0,9573 

0,9582 

0,9591 

0,9599 

0,9608 

0.9616 

0,9625 

0,9633 

1,8 

0,9641 

09649 

0,9656 

0,9664 

0,9671 

0,9678 

0,9686 

0,9693 

0,9699 

0,9706 

1,9 

0,9713 

0,9719 

0,9726 

0,9732 

0,9738 

0,9744 

0,9750 

0,9756 

0,9761 

0,9767 

2.0 

0,9772 

0,9778 

0,9783 

0,9788 

0,9793 

0,9798 

0,9803 

0,9808 

0,9812 

0,9817 

2.1 

0.9821 

0,9826 

0,9830 

0,9834 

0,9838 

0,9842 

0,9846 

0,9850 

00854 

0,9857 

2,2 

0,9861 

0,9864 

0,9868 

0,9871 

0,9875 

0,9878 

0,9881 

0,9884 

0,9887 

0,9890 

2,3 

0,9893 

0,9896 

0,9898 

0,9901 

0,9904 

0,9906 

0,9909 

0,9911 

0,9913 

00916 

2,4 

0.9918 

0,9920 

0,9922 

0,9925 

0,9927 

0,9929 

0,9931 

0,9932 

0,9934 

00936 

2,5 

0,9938 

0,9940 

0,9941 

0,9943 

0,9945 

0,9946 

0.9948 

0,9949 

0,9951 

0,9952 

2,6 

0,9953 

0.9955 

0,9956 

0,9957 

0,9959 

0,9960 

0,9961 

0,9962 

0,9963 

0,9964 

2,7 

0,9965 

0,9966 

0,9967 

0,9968 

0,9969 

0,9970 

0,9971 

0,9972 

0,9973 

0,9974 

2,8 

0,9974 

0,9975 

0,9976 

0,9977 

0,9977 

0,9978 

0,9979 

0.9979 

0,9980 

00981 

2,9 

0,9981 

0,9982 

0,9982 

0,9983 

0,9984 

0,9984 

0,9985 

00985 

09986 

0,9986 

3,0 

0,9987 

0,9987 

0,9987 

0,9988 

0,9988 

0,9989 

0,9989 

0,9989 

0,9990 

0,9990 

3,1 

0,9990 

0,9991 

0,9991 

0,9991 

0,9992 

0,9992 

0,9992 

0,9992 

0,9993 

0,9993 

3,2 

09993 

0,9993 

0,9994 

0,9994 

0,9994 

0,9994 

0,9994 

0,9995 

0,9995 

0,9995 

3,3 

0.9995 

0,9995 

0,9995 

0,9996 

0,9996 

0,9996 

0,9996 

0,9996 

0,9996 

0,9997 

3,4 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9998 

3,5 

0,9998 

0,9998 

0,9998 

0,9998 

0,9998 

0,9998 

0,9998 

0.9998 

0,9998 

00998 

3,6 

0,9998 

0,9998 

0,9999 

0,9999 

0,9999 

0,9999 

0,9999 

0,9999 

0,9999 

0,9999 
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El caso general puede reducirse al canonico introduciendo el cambio de variable 
>' = (« — m )/cr en la integral que define F. Esto nos lleva a la formula 

La tabla 14.1 es una tabla de valores de 4? (f) con cuatro cifras decimales 
para valores de t espaciados en intervalos de amplitud 0,01 desde t = 0,00 a 
t = 3,69. La grafica de 4>(1) esta representada en la figura 14.9. La grafica de la 
densidad / es la famosa «curva de campana», dibujada en la figura 14.10. La 
parte aha de la campana corresponde a la media m. Para valores grandes de <x la 
curva se achata, y para valores pequenos de <t la curva de campana se estrecha y 
en el maximo tiene un aspecto mas pronunciado, como en la figura 14.10. 

La distribucion normal es una de las mas importantes entre las distribuciones 
continuas. Muchas variables aleatorias que se presentan en la naturaleza se com- 
portan como si su distribucion fuera normal o aproximadamente normal. Como 
ejemplos citaremos la medida de la estatura de los individuos de una gran pobla- 
cion, ciertas medidas sobre grandes poblaciones de organismos vivos que se pre¬ 
sentan en Biologia, y los errores de observation encontrados al hacer un gran nu- 
mero de mediciones. En Ffsica, la ley de Maxwell de las velocidades implica que 
la funcion de distribucion de la velocidad, en cualquier direction dada, de una 
molecula de masa M en un gas a la temperatura absoluta T es normal con me¬ 
dia 0 y varianza M/(kT) donde k es una constante (constante de Boltzmann). 

La distribucion normal es tambien de importancia teorica debido a que pue¬ 
de utilizarse para aproximar las distribuciones de muchos fenomenos aleatorios. 
Un ejemplo es la distribucion binomial con parametros n y p. Si X es una varia¬ 
ble aleatoria con distribucion binomial de parametros n y p, la probabilidad 
P(a ^ X ^ b) viene dada por la suma 



donde q = 1 — p. Para n grande son necesarios calculos laboriosos para hallar 
esta suma. En la practica se evitan estos calculos mediante la formula aproximada 



en donde el simbolo ~ significa que los dos miembros de 14.25 son asintotica- 
mente iguales; esto es, que la razon del primer miembro al segundo tiende a 1 
cuando n -> El limite expresado en (14.25) es una caso particular del llamado 
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Figura 14.11 Funcion densidad de una distribution normal considerada como aproximacion 
de la funcion de masa de probabilidad de una distribution binomial. 

teorema central del 1'imite del Calculo de probabilidades. Este teorema (discutido 
con detalle en la section 14.30) explica la importancia teorica de la distribucion 
normal. 

La figura 14.11 da una idea de la formula de aproximacion (14.25) y mues- 
tra que puede ser exacta para un valor relativamente pequeno de n. Las rectas 
punteadas son las ordenadas de la funcion de masa de probabilidad p de una 
distribucion binomial de parametros n=10 y p = Vo- Esas ordenadas fueron calcu- 
ladas con la formula 


P(0 = p (X = 0 = ^ para f = 0, 1, 2,.... 10. 


Las ordenadas para t — 7, 8, 9, y 10 no han sido dibujadas porque sus valores 
numericos son muy proximos a cero. Por ejemplo, p(10) = (If,) 10 = 2'"/10 10 = 
= 0,0000001024. La curva dibujada es la grafica de la funcion densidad / de una 
distribucion normal (con media m — np = 2 y varianza a- = npq — 1,6). Para 
calcular la probabilidad P{a ^ t ^ b) a partir de la funcion de masa p surnames 
los valores de pit) en los puntos en que esta concentrada la masa del intervalo 
— t— 6. Cada valor p{t) puede interpretarse como el area de un rectangulo de 
altura pit) colocada sobre un intervalo de longitud unidad centrado en t. (Como 
ejemplo, vemos en la figura 14.11 un rectangulo de esos centrado en / = 3.) La 
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formula (14.25) cs el resultado de sustituir las areas de esos rectangulos por el 
area del conjunto de ordenadas de / sobre el intervalo \_a — b + ((.]. 

14.15 Observaciones sobre distribuciones mas generates 

En las secciones precedentes hemos comentado ejemplos de distribuciones dis- 
cretas y continuas. Los valores de una distribucion discreta se calculan sumando 
los valores de la funcidn de masa de probabilidad correspondiente. Los de una 
distribucion continua se calculan integrando la funcion de densidad. Existen, natu- 
ralmente, distribuciones que no son discretas ni continuas. Entre estas estan las 
llamadas de tipo «mixto» en las que la distribucion de masas es parcialmente dis¬ 
creta y parcialmente continua. (En la figura 14.3 se ha dibujado un ejemplo.) 

Una distribucion F se llama mixta si puede expresarse como combination 
lineal de la forma 

(14.26) F(t) = + c 2 F 2 (t), 

siendo Ft discreta y F 2 continua. Las constantes Ci y c 2 deben satisfacer las re- 
laciones 


0 < Cj < 1, 0 < c 2 < 1, + c 2 = 1. 

Las propiedades de las distribuciones mixtas pueden deducirse estudiando las que 
son discretas o continuas y recurriendo entonces a la linealidad expresada en la 
igualdad (14.26). 

Un tipo de integral, conocida con el nombre de integral de Riemann-Stieltjes, 
hace posible el manejo simultaneo de los casos discreto, continuo y mixto.p) Si 
bien esta integral unifica el estudio teorico de las funciones de distribucion, en 
cualquier problema el calculo de las probabilidades debe reducirse a la integracion 
y a la suma ordinarias. En esta exposicion introductoria no pretendemos describir 
la integral de Riemann-Stieltjes. En consecuencia, gran parte de los temas los 
discutimos paralelamente, a pares, uno para el caso discreto y otro para el conti¬ 
nuo. Sin embargo, daremos unicamente los detalles de manera completa para uno 
de los casos, dejando para el lector el trabajo de completar los demas. 

Aun la misma integral de Riemann-Stieltjes es inadecuada para tratar las 
funciones de distribucion mas generates. Pero un concepto mas potente, la integral 
de Lebesgue-Stieltjes (*), nos permite tratar satisfactoriamente todos los casos. Sin 
un conocimiento de este tipo de integral no se puede realizar el estudio de la 
teoria de probabilidades desde un punto de vista superior. 

(*) En el capitulo 9 de la obra del autor Analisis Matematico, Editorial Reverie, Bar¬ 
celona, 1963, puede verse una exposicion amplia de la integral de Riemann-Stieltjes. 

(*) Vease cualquier libro de teoria de la medida. 
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14.16 Ejercicios 


1. Sea X una variable aleatoria que mide la vida (en horas) de un cierto tipo de tubo de 
vaci'o. Supongamos que X tiene una distribution exponential eon parametro A = 0,001. 
Determinar T de modo que P(X > T) sea a) 0,90; b) 0.99. Puede emplearse en el calculo 
la formula aproximada — log (1 — x) = x + x-/2. 

2. Un material radioactivo sigue una ley de desintegracion exponencial con vida media de 
2 anos. Consideremos el tiempo de desintegracion X (en anos) de un atomo y suponga¬ 
mos que X es una variable aleatoria con una distribution exponential. Calcular la pro¬ 
babilidad de que un atomo se desintegre a) en el intervalo 1 < X < 2; b) en el intervalo 
2 < X < 3; c) en el intervalo 2 < X < 3, en el supuesto de que no se ha desintegrado 
en el intervalo 0 < X < 2; d) en el intervalo 2 < X < 3, en el supuesto de que no se 
ha desintegrado en el intervalo 1 < X < 2. 

3. La duracion (en minutos) de las llamadas telefonicas a larga distancia desde Caltech se 
vio que es un fenomeno aleatorio con funcion densidad de probabilidad 


/(') = 


ce ( 
0 


para t > 0, 
para t <, 0. 


Determinar el valor de c y calcular la probabilidad de que una llamada a larga distan¬ 
cia dure a) menos de 3 minutos; b) mas de 6 minutos; c) entre 3 y 6 minutos; d) mas 
de 9 minutos. 

4. Dadas las constantes reales X > 0 y c. Sea 


n e M ») s ; t > c, 

m = 

10 si t < c. 


Comprobar que /(f) dt = 1, y determinar una funcion de distribucion F que tenga / 
como densidad. fista se llama distribucion exponencial con dos parametros, un parametro 
de amortiguamiento X y un parametro de position c. 

5. Establecer y demostrar una extension del teorema 14.9 para distribvciones exponenciales 
con dos parametros X y c. 

6. Una variable aleatoria X tiene una distribucion exponencial con dos parametros X y c. 
Sea Y = aX -f b, siendo a > 0. Demostrar que Y tiene tambien una distribucion expo¬ 
nencial con dos parametros X' y c', y determinar esos parametros en fundon de a,b,c y X. 

7. En el ejercicio 16 de la seccion 11.28 se demostro que e~ x2 dx = yjrrjl. Utilizer este 
resultado para demostrar que para a > 0 tenemos 



8. Una variable aleatoria X tiene una distribucion normal canonica 4>. Demostrar que 
a) 4>( — x) = 1 - <Kx); b) P(\X\ < k) = 2*(k) - 1; c)P(|X| > k) = 2(1 - 4>(k)). 

9. Una variable aleatoria X tiene una distribucion normal canonica <l>. Utilizar la tabla 14.1 
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para calcular cada una de las siguientes probabilidades: a) P(X > 0); b) P(1 < X < 2); 
c) P(X < 3); d) PCX\ >2). 

10. Una variable aleatoria X tiene una distribucidn normal candnica <t>. Utilizar la tabla 

14.1 para encontrar un numero c tal que a) P(|X| > c) =|; b) P(|X| > = 0,98. 

11. Supongamos que X tiene una funcion de distribucion normal F con media m y varian- 

za a' 1 , y designemos con <1> la distribucidn normal canonica. 

a) Probar que 

b) Hallar un valor de c tal que P(\X — m\ > c) = J. 

c) Hallar un valor de c tal que P(|X — m\ > c) = 0,98. 

12. Una variable aleatoria esta distribuida normalmente con media m = 1 y varianza 

a- = 4. Calcular cada una de las probabilidades siguientes: a) P( — 3 < X < 3); 

b) P( —5 < X < 3). 

13. Un arquitecto esta disenando un portal de un edificio que tienen que utilizar personas 
cuya altura esta distribuida normalmente, con media m = 5 pies 9 pulgadas, y va¬ 
rianza a- siendo a = 3 pulgadas. (.Que altura minima puede dar al portal para que 
no mas del 1 % de las personas choquen con su cabeza en la parte superior del mismo? 

14. Si X tiene una distribucion normal canonica, demostrar que la variable aleatoria 
y = aX -f b es tambien normal si a ^ 0. Determinar la media y la varianza de Y. 

15. Supongamos que una variable aleatoria X tiene una distribucion normal canonica, y 
pongamos Y = X 2 . 

a) Demostrar que F r (t) = L f V e~ u2 l 2 du si / > 0. 

V 277 Jo 

b) Determinar F Y (t) cuando t < 0 y describir la funcion densidad f r . 


14.17 Distribuciones de funciones de variables aleatorias 

Si <p es una funcion real cuyo dominio incluye el rango de la variable aleato¬ 
ria X, podemos construir una nueva variable aleatoria Y mediante la ecuacion 

Y — <p(X), 

lo que significa que Y(<o) =<p[X(<»)] para cada <o del espacio muestral. Si conoce- 
mos la funcion de distribucion F x de X, (.como encontramos la distribucion Fy 
de Y? Comenzamos con un caso particular importante. Supongamos que <f es con- 
tinua y creciente en sentido estricto en todo el eje real. En este caso <p posee una 
funcion inversa continua y estrictamente creciente, y es: 

y — (p(x ) si, y solo si x = yj(y). 

Segun la definicion de F r tenemos, 


F y (t) = P(Y<t) = P[<p(X)<t]. 
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Puesto que y es estrictamente creciente y continua, los sucesos <«p(x) — t» y 
«X ^ son identicos. Por lo tanto, P[<p(X) ^ t] = P[X ^^(0] = FxCvW]* 
Luego las distribuciones Fy y F x estan ligadas por la ecuacion 

(14.27) F y (t) = F x [ W (t)]. 

Cuando la distribucion F x y la funcion V son derivables podemos derivar am- 
bos miembros de (14.27), utilizando en el segundo miembro la regia de la cadena, 
para obtener 


F'r(t) = F' x [y(t)] • w \t). 

Esto nos proporciona la siguiente relation entre las densidades. 

fy(t) = fxMO] ■ 

ejemplo 1. Y = aX + b, a > 0. En este caso tenemos: 

_ J 

<p(x ) — ax + b, yiy) =-, y>’(y) = - ■ 

a a 

Ya que q> es continua y estrictamente creciente podemos escribir: 

ejemplo 2. Y = X 2 . En este caso cp(x) = x 2 y el razonamiento anterior no 
es directamente aplicable pues <p no es estrictamente creciente. No obstante, pode¬ 
mos usar el mismo metodo para determinar Fy y fy. Por definicion tenemos: 

F r (t) = P(X 2 < t). 

Si t < 0 el suceso «X 2 t» es vacio y por tanto P(X 2 < t) = 0. Por consiguiente 
F r (t) = 0 para t < 0. Si t > 0 tenemos 

P(X 2 <t) = P(-yTt < X < VO = P Y (V0 - F x (St) + P{X = -sjt). 

Para una distribucion continua Fx tenemos P(X = — V7) = 0 y obtenemos la 
siguiente relacion entre Fy y F x : 

(0 si t < 0, 

*V(0= 

{F x (s/t)- F x (-s/t) si r>0. 
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Para todo t < 0 y para aquellos valores de t > 0 tales que F x es derivable 
en VT y en — VFtenemos la siguiente relacion entre las densidades: 

( 0 si t < 0, 

. 

- ^ - s ' ' >0 ' 

Otros problemas de este tipo se discutiran en la seccion 14.23 con la ayuda 
de variables aleatorias bidimensionales. 

14.18 Ejercicios 


1. Supongamos que X tiene una distribution uniforme en el intervalo [0,1], Determinar 
la funcion de distribution F y y la densidad f r de la variable aleatoria Y si: 

a) Y = IX + 1 , d) Y = log 1*1 , 

b) Y = -3* +1, e) Y = log* 2 , 

c) Y = X\ f) Y=ex. 

2. Sea X una variable aleatoria con una funcion de distribucion continua F x . Si <p es con- 

tinua y estrictamente creciente en todo eje real y si <p(x) —» a cuando x —> — °° y 
y(x) —> b cuando x —» determinar la funcion de distribucion F y de la variable alea¬ 

toria Y = <p(X). Calcular tambien la densidad fy, suponiendo que Fx y <p son deri- 
vables. 

3. Supongamos que X tiene distribucion normal canonica. Determinar la funcion de den- 
sidad de la variable aleatoria * cuando 

a) Y = X 2 , c) Y = e x , 

b) Y = |*|d) Y = arctan *. 


14.19 Distribucion de variables aleatorias bidimensionales 

El concepto de distribuci6n puede generalizarse a variables aleatorias n di- 
mensionales. La consideracion del caso n — 2 nos indicara como puede procederse 
en los demas. 

Si X e Y son dos variables aleatorias unidimensionales definidas en un espa- 
cio muestral comun S, ( X, Y ) representara la variable aleatoria bidimensional 
cuyo valor en un punto generico to de S queda determinado por el par de numeros 
reales (X(<o), y(toV). La notacion 


* < a, Y<,b 

es una forma abreviada de designar el conjunto de todos los elementos to de S tales 
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que X(w) ^ a e Y(«>J ^ b; la probabilidad de este suceso se representa por 

P(X < a, Y <b). 

Analogamente se definen las notaciones a < X ^ b, c < Y ^ d, y P(a < X ^ b, 
c<Y ^d). 

El conjunto de puntos (x, y) tales que x^aey^besel producto cartesiano 
A X B de los dos intervalos infinitos unidimensionales A = {x\x } y 
B = {y|y<6}. El conjunto A x B se representa geometricamente por la region 
rectangular infinita dibujada en la figura 14.12. El numero P(X ^ a, Y ^ b) re¬ 
presenta la probabilidad de que un punto (X(»), Y(«)) este situado en esa region. 
Estas probabilidades se utilizan para definir las distribuciones de probabilidad bi¬ 
dimensionales. 

definicion. La funcion de distribution de la variable aleatoria bidimensio- 
nal (X, Y) es la funcion real F definida para todo par de numeros reales a y b 
mediante la igualdad 


F(a, b) — P(X < a, Y<b). 


que tambien se conoce como distribution conjunta de las dos variables unidimen¬ 
sionales X e Y. 


Para calcular la probabilidad de que (X, Y) este en un rectangulo, empleamos 
el siguiente teorema, generalizacion del teorema 14.2 b). 



Figura 14.12 Region rectangular infinita Figura 14.13 El suceso «X < b. Y < d» 
A x B, siendo A = {x\x<a} expresado como reunion de cuatro sucesos 
y B = {y|y<&}. disjuntos. 
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teorema 14.10. Si F es la funcidn de distribution de una variable alea- 
toria bidimensional (X, Y) y si a<b y c<d, entonces 

(14.28) P(a < X<,b,c < Y <, d) — F(b, d) — F(a, d) - F(b, c ) + F(a, c ). 

Demostracion. Los dos sucesos «X ^ a, c < Y d» y «X ^ a, Y ^ c» son 
disjuntos, y su reunion es «X — a, Y ^ d». Sumando las probabilidades obtenemos 
P(X ^ a, c < Y ^ d) + P(x ^ a, Y ^ c) = P(X ^ a, Y ^ d); luego, 


P(X <, a, c < Y ^ d) = F(a, d) - F(a, c). 
Analogamente, tenemos: 

P(a < X <, b, Y < c) = F(b, c) - F(a, c). 


Los cuatro sucesos 

“X<,a,Y<,c” “X <, a, c < Y <, d," 

“a < X <, b, Y <; c,” “a<X<b,c < Y <, d” 

son disjuntos, y su reunion es «X < b,Y ^ d». (Vease figura 14.13.) Sumando las 
correspondientes probabilidades y en virtud de las dos igualdades precedentes obte¬ 
nemos: 

F{a, c) + [F(a, d) - F(a, c)] + [F(b, c ) - F(a, c)] + 

+ P(a<X<,b,c < Y <, d) = F(Jb,d ), 
que equivale a (14.28). 

La formula (14.28) da la probabilidad de que la variable (X, 7) tenga un 
valor interior al rectangulo (a, 6] x (c, d]. Existen, como es natural, las corres¬ 
pondientes formulas para los rectangulos [a, b] X [c, d], (a, b) X (c, d), 
[a, b) X [c, d), etc. 


Observacidn. El concepto de masa de probabilidad tambien puede extenderse al 
caso bidimensional. Aquf la masa total 1 esta distribuida sobre el piano. La probabili¬ 
dad P(a < X < b, c <Y < d) representa la cantidad total de masa situada en el rec¬ 
tangulo (a, b] x (c, d]. El numero F(a, b) representa la cantidad en la regidn rectan¬ 
gular infinita X < a, Y < b. Como en el caso unidimensional, los dos tipos mas 
importantes de distribuciones son las discretas y las continuas. En el caso discreto 
toda la masa est4 concentrada en un numero finito o en una infmidad numerable 
de puntos. En el caso continuo la masa esta repartida sobre el piano con un espe- 
sor uniforme o variable. 
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14.20 Distribuciones discretas bidimensionales 

Dada la variable aleatoria (X, Y) podemos definir una nueva funcion p, 11a- 
mada la funcidn de masa de probabilidad de (X, Y), tal que 


p(x,y) = P(X = x,Y = y) 


para todo par de numeros reales (x, y). Sea T el conjunto de puntos (x, y ) para 
los cuales p(x, y) > 0. Puede demostrarse que T es finito o infinito numerable. 
Si la suma de las probabilidades p(x, y) para todo (x, y) de T es igual a 1, esto 
es, si 

(14.29) I P(x, y) = 1, 

(x,y)eT 


la variable aleatoria (X, 7) se llama discreta. Los puntos ( x, y) de T son puntos 
de masa de (X, Y). 

Supongamos que x lt x 2 , x 3 ,... e yi, y 2 , y 3 ,... son valores posibles de X e Y 
respectivamente, y sea 


Pij = P(X=x t , Y = yi ). 

Si cada py es positiva y la suma de todas las py es 1, la probabilidad del suceso 
«(X, Y) e £» es la suma de todas las py considerando todos los Xi e y, para los 
que (Xi, y,) e E. Indicamos esto escribiendo 


P[(X, y) e £] = 22 Pu • 


Xi Vj 

( x it yj)sE 


En particular, puesto que P(X ^ x, Y ^ y) = F(x, y), la distribucion conjunta F 
(que tambien se llama discreta) viene dada por la doble suma 

(14.30) F (x,y)=2 2 Pu- 

Xi<X Vj<u 


Los numeros py tambien pueden usarse para reconstruir las funciones de masa 
de probabilidad p x y pv de las variables aleatorias unidimensionales X e Y. En 
efecto, si Ey representa el suceso «X = Xi, Y = y ,», los sucesos Ey, E- n , E i3 , . . . 
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son disjuntos y su reunion es el suceso «X = x,». Luego, por aditividad numera¬ 
ble, obtenemos 

( 14 - 31 > P(X = x i )=fp(E ll ) =2 Pt) - 

3=1 3=1 

Analogamente, obtenemos 

(14.32) P(Y = y,) = f P(E U ) = | Pij . 

1=1 1=1 

Por lo tanto, las correspondientes distribuciones unidimensionales F x y Fy pueden 
calcularse a partir de las formulas 

Px(t) = 1P(X = Xi ) = 2 !>„ 

Xi<t Xi<t 3 =1 

y 

FAt) = 2P(Y = yj ) = 2 2 p«. 

Vj<t Vj<ti =1 

Para espacios muestrales finitos, naturalmente, las series deben reemplazarse por 
sumas finitas. 

14.21 Distribuciones continuas bidimensionales. Funciones de densidad 

Como podia suponerse, las distribuciones continuas son las que son continuas 
en todo el piano. Para la mayorfa de las distribuciones continuas F que se presen- 
tan en la practica existe una funcion no negativa / (que se llama densidad de pro- 
babilidad de F) tal que las probabilidades de la mayor parte de los sucesos que 
nos interesan pueden calcularse por doble integracion de la densidad. Esto es, 
la probabilidad de un suceso «(X, Y) e Q» es: 

(14-33) P[(X, 7)661 = JJ7. 

Q 

Cuando tal funcion / existe se llama tambien densidad de probabilidad de la varia¬ 
ble aleatoria (X, Y), o densidad conjunta de X e Y. No intentaremos describir la 
clase de regiones Q para las que (14.33) es valida, tan solo mencionaremos que 
esta clase es lo bastante amplia para incluir todas las regiones que se presentan 
en las aplicaciones ordinarias de las probabilidades. Por ejemplo, si existe una 
densidad conjunta tenemos siempre 

P(a<X<b,c<Y <d) = // f(x, y ) dx dy, 

R 


(14.34) 
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donde R = [a, b~\ X [c, d]. El integrando / frecuentemente es tal que la integral 
doble se puede calcular por integration unidimensional repetida en cuyo caso 
(14.34) se transforma en 


P(a < X < b, c < y < d) = £ [J o f(x, y) dxj dy = £ [£ f(x, y) dyj dx. 


En todos los ejemplos que consideraremos, esta formula es tambien valida en los 
casos limite en los que a y c se sustituyen por — <» y b y d por + °°. Asf pues, 
tenemos 


(14.35) F(b, d) = il [£„ /(*. y) dx i dy = L [Loo f{x ' y ) dy ] dx 
para todo par b y d, y 

f+oo p c+oo -| C+co rf+oo -i 

(14.36) LL f{x, y ) dx J dy = [L /(*• ^ ^ = 1. 


Las igualdades (14.35) y (14.36) son las correspondientes a las (14.30) y (14.29) 
de los casos discretos, respectivamente. 

Si existe una densidad no es unica, ya que el integrando en (14.33) puede 
modificarse en un numero finito de puntos sin afectar el valor de la integral. Sin 
embargo, existe a lo mas una funcion de densidad continua. En efecto, en los 
puntos de continuidad de f tenemos las formulas 


f(x,y) = D 12 F(x, y) = D 2 l F(x,y), 

obtenidas por derivacion de las integrales (14.35). 

Como en el caso discreto, la densidad conjunta / puede usarse para calcular 
las densidades unidimensionales fx y fr- Las formulas analogas a las (14.31) y 
(14.32) son 


r+°° f+oo 

fx(x) = f( x ’ y) dy y f Y {y) = J ^ fix, y) dx. 

Las correspondientes distribuciones F x (t) y Fy(t) se obtienen, naturalmente, inte¬ 
grando las respectivas densidades fx y fr entre — °o y t. 

Las variables aleatorias X e Y se llaman independientes si la distribucion 
conjunta F(x, y) puede factorizarse como sigue 


F(x,y) = F x (x)F r (y) 



666 


Calculo de probabilidades 


para todo (x, y). En la proxima seccion de ejercicios se discutiran algunas conse- 
cuencias de la independencia. 


ejemplo. Consideremos la funcion / que tiene el valor constante 1 sobre el 
cuadrado R — [0, 1] X [0, 1], y el valor 0 en el resto del piano. Una variable 
aleatoria ( X , Y ) que tenga esta funcion de densidad se llama distribuida unijorme- 
mente sobre R. La correspondiente funcion de distribucion F es: 



'xy 

si 

(x,y)eR, 



X 

si 

0 < X < 1 y 

y>u 

F(x,y) = i 

y 

si 

0<y<l y 

X > 1, 


i 

si 

x > 1 y 

y>i. 



en los demas puntos. 



La grafica de F sobre R es una parte de la superficie z = xy (silla de montar). En 
los puntos interiores de R existen las derivadas parciales mixtas D 1i2 F(x, y ) y 
D 2 .iF(x, y) y son iguales a f(x, y). Esta distribucion es el producto de dos distri- 
buciones uniformes unidimensionales Fx y Fy. Luego X e Y son independientes. 

14.22 Ejercicios 


1. Sean X e Y dos variables aleatorias unidimensionales con distribuciones F x y Fy, y sea 
F la distribucion conjunta de X e Y. 

a) Demostrar que X e Y son independientes si, y sdlo si, tenemos 


P(a < X <, b, c < Y <,d) = P(a < X <, b)P(c < Y <, d) 


2. 


cualesquiera que sean a, b, c, d, con a < b y c < d. 

b) Consideremos el caso discreto. Supongamos que x 1>X2 ,... e yi,y 2 ... son los puntos 
dejnasa d e X e Y, respectivamente. Sean a, = P(X = Xi ) y b, = P(Y = y,). Si 
to'dc7 par f ~j **’ ^ ~ demostrar que X e Y son independientes si p,, = a,b/ part 

c) Supongamos que X e Y tienen distribuciones continuas con las densidades U y U 
y sea / la densidad de la distribucion conjunta. Admitamos la continuidad de las tres 
densidades Demostrar que la condicidn de independencia es equivalente a la afirma- 

cion /(a: yj _/ y (y) para todo (x, y). [ Indicacidn: Expresar / como derivada de la 
distnbucidn conjunta F.] 

En d ejercicio^ 1 suponer que P(X = x 1( Y = y L ) = P(X = * 2 , y = y 2 ) = p/2 y que 

ai n Pf Xl ’ ■ , y2 P uX. Y, X2 ,’ Y — y^ — siendo p y q no negativas de suma 1. 

a) ^ Determinar las probabilidades unidimensionales P(X = Xl ) y P(Y = y ; ) para i = 1,2 

b) i,Para que valor (o valores) de p seran independientes X e Y? 
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3. Si a < b y c < d, definir / del modo siguiente: 


f( x >y) 


1 

(b - a)(d - c ) 

lo 


si (x,y) e [a,b] x [c,d], 
en cualquier otro caso. 


a) Comprobar que esta es la densidad de una distribution continua F y determinarla. 

b) Determinar las distribuciones unidimensionales F x y F r . 

c) Determinar si X e Y son o no independientes. 

4. Si P(Y < b) t* 0, la probabilidad condicionada de que X < a, dado que Y < b, se re- 
presenta con el sfmbolo P(X < a \ Y < b), y se define mediante la igualdad 


7>(X ^ a | Y <, b) = 


P{X <,a,Y £b) 
P(Y^b) 


Si P(Y < b) = 0, definimos P(X < a | K < b) = P(X < a). Analogamente, si 
P(X < a) * 0, definimos P(F £ b \ X <, a)= P(X ^ a,y ^ b)/P(X £ a),SiP(X ^ a)= 0, 
definimos P(V < b | X < a) = P(Y < b). 

a) Probar la independencia de X e Y y expresarla en funcidn de probabilidades condi- 
cionadas. 

b) Considerar el caso discreto. Supongamos que Xi,X 2 ,... e yi,y 2 ,... son los puntos 
de masa de X e Y respectivamente. Demostrar que 


P(X = x t ) = ^ P( Y = y } )P(X = Xi \ Y= yj ) 

i= i 

y 

P(Y = y,) = S ^ ^ I x = *,). 

<-i 


5. Una casa de juego ofrece a sus clientes el juego siguiente: Se lanza una moneda. Si el 
resultado de la primera tirada es cruz, el jugador pierde y el juego vuelve a empezar. 
Si en cambio sale cara, vuelve a echarse la moneda. Si en la segunda tirada aparece 
cara el jugador gana 2 dolares, pero si sale cruz gana s61o 1 dolar. Sea X la variable 
aleatoria que vale 1 6 0 segun que en la primera tirada aparezca cara o cruz. Sea Y otra 
variable aleatoria que cuenta el numero de dolares ganados por el jugador. Hacer uso del 
ejercicio 4 (o de algun otro metodo) para calcular P(Y = 0), P(Y = 1), y P(Y = 2). 

6. Haciendo referencia a! ejercicio 4, deducir la llamada formula de Bayes: 


P(X = **| Y^y,) = 
P(Y~y k |X = *,-) = 


P(X = x k )P(Y=y J \X = x k ) 
I,?! P(X = x t )P{ Y = y, | X = * f ) ’ 

P(Y — y k )P(X = x, | Y=y k ) 
l£iP(Y=y,)P(X = x i \ Y=y,)- 


7. Dadas dos urnas A y B. La urna A contiene un billete de 5 dolares y dos de 10 do- 
lares. La urna B contiene tres billetes de 5 ddlares y uno de 10 dolares. Se extrae un 
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billete de A y se introduce en B. Sea F la variable aleatoria que cuenta el valor del 
billete transferido. A continuacidn se extrae un billete de la urna B y usamos la variable 
aleatoria X para contar su valor. Calcular las probabilidades condicionadas 

P(F = 5 | X = 10) y />(F = 10 | X = 10). 

[ Indication : Hacer uso de la formula de Bayes del ejercicio 6 .] 

8 . Dadas tres cajas identicas, cada una de las cuales tiene dos departamentos. La caja nu- 
mero 1 tiene una moneda de oro en un departamento y una de plata en el otro. La caja 
2 tiene una moneda de oro en cada departamento y la caja 3 una moneda de plata en 
cada departamento. Se abre al azar un departamento y se encuentra una moneda de 
oro. Calcular la probabilidad de que el otro departamento de la misma caja contenga 
una moneda de plata. [ Indicacidn: Emplear la formula de Bayes.] 

9. Sea Q una region plana y a(Q) su area. Se dice que una variable aleatoria bidimen- 
sional (X, Y) tiene distribucidn uniforme sobre Q si su funcion de densidad / viene 
definida por las formulas: 


f(x,y) = 




si (x,y)eQ, 
si (x,y)<£Q. 


a) Si E es una subregion de Q con area a(E), demostrar que a(E)/a(Q) es la pro¬ 
babilidad del suceso (X, Y) e E. 

b) Caen al azar gotas de agua sobre el cuadrado Q de vertices (1,0), (0,1), (-1,0), 
(0, -1). Un resultado es el punto (x,y) de Q alcanzado por una determinada gota. Sean 
X(x, y) = x e Y(x, y) = y y supongamos que (X, Y) tiene distribucidn uniforme sobre Q. 
Determinar la funcion de densidad conjunta f y las densidades unidimensionales f x 
y f r . 4 Son independientes las variables Kef? 

10. Una variable aleatoria bidimensional (X, F) tiene la funcion de distribucidn conjunta 
F. Sean U = X - a, V = F - b, siendo a y b constantes. Si G representa la distribu¬ 
cidn conjunta de (U, V) demostrar que 

G(u, v ) = F(u + a, v + b). 

Deducir una relacidn semejante entre las funciones de densidad / de (X, F) y g de 
(U, V) cuando f es continua. 


14.23 Distribuciones de funciones de dos variables aleatorias 

Consideremos ahora un problema mas general. Si X e Y son variables alea¬ 
torias unidimensionales con distribuciones conocidas, £como encontramos la dis- 
tribucion de nuevas variables aleatorias tales como X + Y, XY o X 2 + F 2 ? El 
resto de esta seccion se dedica a exponer un metodo que nos ayuda a contestar 
preguntas como esta. Definimos dos nuevas variables aleatorias U y V con ecua- 
ciones de la forma 


U = M{X, Y), V=N(X, F), 
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donde M(X, Y) o N(X, Y ) es la combinacion particular en la que estamos intere- 
sados. A partir del conocimiento de la distribucion conjunta f de la variable alea- 
toria bidimensional (X, Y) calculamos la distribucion conjunta g de (U, V). Una 
vez se conoce g, las distribuciones de U y de V se encuentran facilmente. 

Para describir el metodo con detalle, consideremos una aplicacion uno a uno 
del piano xy sobre el piano uv definida por el par de ecuaciones 

u = M(x, y), v = N(x,y). 

La aplicacion inversa sea la definida por 

x = Q{u, v), y = R(u, v ), 

y supongamos que Q y R tienen derivadas parciales continuas. Si T es una region 
en el piano xy, sea T' su imagen en el piano uv, como se ve en la figura 14.14. 
Sean X e Y dos variables aleatorias unidimensionales continuas que tengan una 
distribucion conjunta continua y sea / la funcion de densidad de probabilidad de 
(X, Y). Definamos las nuevas variables aleatorias U y V escribiendo U = M(X, Y), 
V = N(X, Y). Para determinar la densidad g de la variable aleatoria (t/, V ) pro- 
cedemos como sigue: 

Las variables aleatorias X e Y estan asociadas a un espacio muestral S. Para 
cada to de S tenemos U(<o) — M[X(<o), Y(<d)], y V(») = N[(w), Y(«*)]. Puesto que 
la aplicacion es uno a uno, los dos conjuntos 


{w | (£/(«), V{o>)) e rj y {o> | (X(o>), Y(o,)) e T} 
son iguales. Por consiguiente. 


(14.37) P[{U, V) e r] = P[(X, Y) e T ]. 

Ya que f es la funcion de densidad (X, Y) podemos escribir 


(14.38) P[(X,Y)eT] = jjf(x,y)dxdy. 

T 

En virtud de (14.37) y de la formula de transformacion de las integrales dobles la 
(14.38) se convierte en: 


P[(U, Y) e V] = 


f f f[Q(u, v), R(u, a)] 

d(Q, R) 

J J 

T' 

d(u, v) 


du dv. 
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u = M(x,y) 
v = N(x,y) 


x = Q(u,v) 
y = R(u,v) 


u 


Figura 14.14 Aplicacidn uno a uno de una regidti T del piano xy sobre una regidn 

T del piano uv. 

Ya que esto es valido para toda regidn T del piano uv la densidad g de (U, V ) 
esta definida por el integrando del segundo miembro; esto es, tenemos: 

( 14 - 39 ) v) =f[Q(u,v), R(u, a)] MiD 

d(u, v ) 

Las densidades fu y fv pueden ahora obtenerse por las formulas 



f 00 r°° 

/u(“) = J_ w g(u, V ) dv, fy(v) = J ^ g(u, V ) du. 

ejemplo 1. Suma y diferencia de dos variables aleatorias. Dadas dos varia¬ 
bles aleatorias unidimensionales X e Y con densidad conjunta f, determinar las 
funciones de densidad para las variables aleatorias U = X + Y y V = X — Y. 

Solucidn. Utilicemos la aplicacidn dada por u = x + y, v = x — y. Esta 
es una transformacidn lineal no singular cuya inversa viene dada por 

w + v _, « u — V 

x — - — Q(«. *>), y = —-— = R(u, v). 

El jacobiano es 

dQ dQ 11 

d(Q, R ) _ du dv 2 2 j 

3 («>«0 dR dR ~ l _ 1 2' 

du dv 2 2 



Distribuciones de funciones de dos variables aleatorias 671 

Aplicando la ecuacion (14.39) vemos que una densidad conjunta g de ( U, V) viene 
dada por la formula 


g(w. 


' . / u + v u — v \ d(Q, R ) 1 f / u + v u — v \ 

,V) ~ J [ 2 ’ 2 ) d(u,v) ~2 J [ 2 ’ 2 )' 

Para obtener una densidad fv = fx+r integramos respecto a v y encontramos 




El cambio de variable x = %(u + v), dx = y 2 dv, transforma esa formula en la 
siguiente: 

1*00 

fx+y( u ) = }_ x f( x ’ u -x)dx. 

Del mismo modo, encontramos 

Zx-rOO = ^ J = I* f(x,x-v)dx. 


Un caso particular importante se presenta cuando X e Y son independientes. 
En este caso la densidad de probabilidad conjunta se escinde en un producto 


/(*> y) =/iW/r(j<), 
y las integrales que dan fx+Y y fx-Y se convierten en 

fx+y( u ) = j_ x fx( x )fy( u ~x)dx, f X -y(v) = fx( x )fy( x -v)dx. 


ejemplo 2. Suma de dos distribuciones exponenciales. Supongamos ahora 
que cada una de las variables X e Y tiene una distribution exponencial, por ejem¬ 
plo fx(t ) = f Y (t) = 0 para t < 0 , y 


fx (0 = xt > fAO = V* "* Para 1 ^ °- 


Determinar la densidad de X + Y cuando X e Y son independientes. 


Solucion. Si u < 0 la integral que da fx+y(u) es 0 ya que el factor f x (x) = 0 
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para x < 0, y el factor /y(w — x) = 0 para x — 0. Si u ^ 0 la integral que da 
/x+y(w) se transforma en 


fx+v(u) = J # “ Ae" dx = /.pe '» u J“ e (f, ~ x)x dx. 

Para calcular la ultima integral consideremos dos casos, /* = A y pAX. 

Si fi = A la integral tiene el valor u y obtenemos 

, , fx+r(“) = A 2 ue~ Xu para « > 0. 

Si p ^ A obtenemos 

_ , -Xu „-uu 

fx+r( u ) = fye " u -—-— = Ip --— para u ;> 0. 

P — A p — X 

ejemplo 3. Maximo y minimo de dos variables aleatorias independientes. 
Sean X e Y dos variables aleatorias unidimensionales con densidades f x y /y y 
funciones de distribution correspondientes F x y Fy. Sean U y V las variables alea¬ 
torias 


U = max {X, Y}, V — min {X, y}. 

Esto es, para cada « en el espacio muestral, [/(«) es el maximo y V(«>) el minimo de 
los dos numeros X((i>), Y(a>). La aplicacion u = max {x, y}, v = min {x, y} no 
es uno a uno, asf que el metodo utilizado para deducir la ecuacion (14.39) no es 
aplicable. Sin embargo, en este caso podemos obtener las funciones de distribu¬ 
cion de U y V directamente. 

Observemos primero que U ^ t si, y solo si, X ^ t e y < t. Por consiguiente 
P(U - t) = P(X ^ t, Y ^ t). En virtud de la independencia esto es igual a 
P(X ^ t)P(Y ^ t) = Fx(0Fy(t). Asf pues, tenemos 

Fu(0 = FxWAO. 


En cada punto de continuidad de f x y f Y podemos derivar esa relation obteniendo 

fu(') = f x (t)F Y {t) + F x (t)fy(t). 

Del mismo modo, tenemos V > t si y solo si X > t e Y > t. Por consiguiente 

F v (0 = P(V < 0 = 1 - P{V > 0 = 1 - P(X > t, Y > 0 = 1 - P(X > t)P(Y > 0 

= 1 - (1 - FxCOXl - Fy(t)) = F x (t ) + Fy(t) - F X (t)Fy(t). 
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En los puntos de continuidad de fx y fr derivamos esa relacion y obtenemos 
fv(t) = fx(0 +fy( 0 ~fx(t)F y {t) - F x (t)Mt). 


14.24 Ejercicios 

1. Sean X e Y dos variables aleatorias unidimensionales independientes, con distribucion 
uniforme cada una sobre el intervalo [0, 1]. Sean U = X + Y y V = X — Y. 

a) Demostrar que U tiene una densidad continua fv dada por 


si 0 < u < 1, 


fuM = /2 -« 


si 1 < u < 2, 

para los demas valores de u 


b) Describir, en forma analoga, una densidad continua fv para V. 

c) Determinar si U y V son o no independientes. 

2. Sean X e Y las del ejercicio 1, y U = max{X,Y}, V = min{X, Y}. 

a) Demostrar que U tiene una funcion de densidad tal que fuU) = 2( para 0 < t < 1, 
y f v (t) = 0 para los demas valores de t. 

b) Describir una funcion de densidad f v para V. 

c) Determinar si U y V son o no independientes. 

3. Sean X e Y dos variables aleatorias unidimensionales independientes, cada una con 
distribucion exponencial con parametro X = 1, y sea f(x, y) = f x (x)f y (y), el producto 
de las densidades de X e Y. 

a) Sea A el conjunto de puntos del piano xy en los que f(x, y) > 0. Dibujar A y su 
imagen A' en la aplicacion definida por u = x + y, v = x/(x + y). 

b) Sean U — X + Y y V = X/(X + Y) dos nuevas variables aleatorias. Calcular la 
densidad g de (U, V). 

c) Calcular la densidad f v . 

d) Calcular la densidad f v . 

4. Sean X e Y dos variables aleatorias independientes, ambas con distribucion normal ca- 
nonica (media = 0, varianza = 1). lntroduzcamos las nuevas variables aleatorias U y V 
mediante las ecuaciones U = X/Y, V = Y. Sea g la funcion densidad de ( U, V). 

a) Demostrar que 


g(u,v) = — — e < 1 +“ 2 )' ,2 /2 s j v <0. 


b) Encontrar una formula parecida para calcular g(u, v) cuando v > 0. 

c) Determinar la funcion densidad de U. 
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5. Supongamos que X tenga la funci6n densidad dada por 


fxM = 


TTy/\ — . 


si —1 < jc < 1, 

« W^l. 


Si una variable aleatoria independiente Y tiene la densidad 


fv(y) = 


'ye ~ vi/2 

0 


si y ^ 0, 
si y < 0, 


encontrar la densidad de Z = XY. 

6. Dadas dos variables aleatorias unidimensionales independientes X e Y con densidades 
continuas f x y fy. Sean U y V dos variables aleatorias tales que X = U cos V, 
Y = U sen V, siendo U > 0 y —i t < V < nr. 

a) Demostrar que U tiene una funcidn de densidad tal que f v (u ) = 0 para u < 0 y 

fu( u ) = u J ^ f x (u cos v)f r (u sent;) dv para u > 0. 

b) Determinar f v y la correspondiente distribucion F v exph'citamente cuando cada una 
de las variables X e Y tiene una distribucion normal con media m = 0 y varianza a 2 . 

7. a) Suponiendo ui > 0 y 02 > 0, comprobar la identidad algebraica 


* ~ m o j + ^ ~ Ob + m 2 ) J 

v ^ - "hA+JJ-m*K 


b) Dadas dos variables aleatorias unidimensionales independientes X e Y. Supongase 
que X tiene una distribucion normal con media mi y varianza a\, y que Y tiene una 
distribucion normal con media m 2 y varianza <r|. Demostrar que X + Y tiene una dis- 
tribucidn normal con media m = mi + m 2 y varianza a 2 = a\ + a\. 

8 . Dadas dos variables aleatorias unidimensionales X e Y con densidades f x y f r y den¬ 
sidad conjunta /. Para cada y fijo, se define 


en donde 


.2 


c 2 = <A + a h 


fx(*\r=y ) = 


f^,y) 

fv(y) 


siempre que f Y (y) > 0. 


Esta es la llamada densidad de probabilidad condicional de X, supuesto que Y = y. 
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Analogamente, definimos la densidad de probabilidad condicional de Y, en el supuesto 
de que X = x, mediante la ecuacion 


fr(y | * = x) 


/(*0Q 

fx(x) 


siempre que fx( x ) > 0. 


a) Si fy y fx son positivas, demostrar que $™„f x (x \ Y = y) dx = f Y {y\X = x) 
dy = 1. 

b) Si f r y fx son positivas, demostrar que 

fx(x) = f°° frWxi* | Y=y)dy y f Y (y) = [°° fx(x)fy(y \ X = x) dx. 

J —00 J ~ co 


9. Una variable aleatoria (X, Y) tiene distribucidn normal bivariada si su densidad es 

f(x,y)=^Re~ 

jLtt 

siendo 


Q(x,y) = A n (x - x 0 ) 2 + 2A 12 (x - x 0 )(y - y 0 ) + A 22 (y - y 0 ) 2 . 


Q se llama «forma cuadratica®. Los numeros Au,Ar’, A 22 son constantes y An > 0. 
El numero D = A 11 A 22 — A 12 se llama discriminante de Q y se supone positivo. Los 
numeros xo e yo son cualesquiera. 

a) Demostrar que Q(x,y) puede reducirse a la suma de cuadrados siguiente: 


/ \ 2 D o 

Q(x, y) = /l u l u + — vj +^~ v > siendo u = x - x 0 , v = y - y 0 . 

+00 

b) Definir la integral doble impropia JJ f(x, y) dx dy como el limite: 

— 00 

+ 00 

j j f(x, y) dx dy = lim j j f(x, y) dx dy, 


R(t) 


en donde R(t) es el cuadrado \—t,t] X [ — t,t J. Demostrar que 


+00 

j j f(x,y)dxdy = 1. 

—00 

[Indicacidn: Utilizar el apartado a) para transformar la integral doble sobre 
R(t) en otra sobre el piano uv. Efectuar entonces una transformacion lineal de va¬ 
riables para simplificar la integral y, por ultimo, hacer tender t a +<».] 
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10. Si una variable aleatoria bidimensional (X, Y) tiene dislribucion normal bivariada como 
se ha dieho en el ejereicio 9, dcmostrar que X e Y son asimismo variables alealorias 
unidimensionales normales con medias Xu e yo respcclivamente, y eon varianzas 
Or-’(X) = A-22/D, a-(Y) = A\\/D. 

11. Si (X.Y) tiene dislribucion normal bivariada, dcmostrar que la variable aleatoria 
Z = X + Y tiene dislribucion normal unidimensional con media + y„ y varianza 
(A,, - 2A rJ + Aj-.)/D. 


14.25 Esperanza y varianza 

La interpretation como masa de las distribuciones de probabilidad puede 
llevarse a un estadio mas avanzado introduciendo los conceptos de esperanza y de 
varianza. Juegan estos, en Calculo de probabilidades, el mismo papel que el «cen- 
tro de gravedad» y el «momento de inercia» en Mecanica. Sin utilizar la integral 
de Stieltjes hay que dar separadamente las definiciones para los casos discreto y 
continuo. 

definiciones de esperanza y varianza. Sea X una variable aleatoria unidi¬ 
mensional. La esperanza de X y la varianza de X son numeros reales que se desig- 
nan con E(X) y Var(X) respectivamente, y se definen como sigue: 

a) Para una variable aleatoria continua con densidad f x , 


tf x (t)dt, 

Var (X) = J_ + J [t - E{X)ff x (t) dt. 


b) Para una variable aleatoria discreta con puntos de masa x x , x 2 ,... y 
probabilidades pk — P(X = x k ), definimos: 

E(X)=fx kPk , 

k= 1 

Var(X)=| ][x k -E(X)f Pk . 

k=l 


Observation. £(X) y Var(X) existen unicamente cuando la integral o la serie en 
cuestion es absolutamente convergente. Se sobreentiende que la serie es una suma 
finita cuando el espacio muestral es finito; en tal caso £(X) y Var(X) existen siem- 
pre. Tambien existen cuando f x es 0 en el exterior de algun intervalo finito. 

La esperanza matematica E(X) es un valor calculado teoricamente asociado 
a la variable aleatoria X. En cierta forma, la distribucion actua como si toda la 
masa estuviera concentrada en un solo punto, E(X). La significacion precisa de la 
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esperanza matematica en la teorfa de las probabilidades se discutira en la sec- 
cion 14.29 en conexion con la llamada «ley de los grandes numeros». 

En Mecanica, el solo conocimiento del centra de gravedad no nos indica la 
forma en que la masa esta extendida o dispersa en torno a su centra. El «segundo 
momento» o «momento de inercia» nos da una medida de esa dispersion. En pro¬ 
babilidades, este segundo momento es la varianza. En la section 14.28 veremos 
que una varianza pequena indica que son improbables las desviaciones grandes 
respecto a los valores esperados. 

Si bien la esperanza matematica E(X) puede ser positiva o negativa, la 
varianza Var(X) siempre es no negativa. Tambien se utiliza el simbolo <r 2 para 
representar la varianza. Su raiz cuadrada positiva se llama la desviacidnt'ipica y se 
representa por a. La desviacion tipica es un promedio ponderado; en realidad, 
<j es la media cuadratica ponderada de la distancia de cada valor de X al valor 
de E(X). En Mecanica, el concepto analogo es el «radio de giro». 

ejemplo 1. Distribution uniforme. Supongamos que X tenga una distribu- 
cion uniforme sobre un intervalo [a, 6]. Entonces /(t) = 1/(6 — a) si a < t< b, 
y f(t) = 0 para los demas valores de t. Por consiguiente, la esperanza de X es: 


E(X) = 



—-— r tdt = j ^=“-±>, 

b — a Ju 2(6 — a) 2 


que es el punto medio del intervalo. Si ponemos m en lugar de (a + 6)/2 y obser- 
vamos que m — a = 6 — m = (6 — a)/2 encontramos: 


Var (X) = —!— P(f - mfdt = f 

0 — a Ja O — a Ja-rr 


u 2 du = 


(6 - a? 

12 


Observemos que la varianza tan solo depende de la longitud del intervalo. 

ejemplo 2. Distribution binomial. Si X tiene distribucion binomial con 
parametros n y p tenemos: 


£(X) =2 fc 

k-Q 


pkqn-Jc 


siendo q = 1 — p. Para calcular esta suma, sea 


/(*> y) = (x + y) n = 


X k y n ~ k 
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y teniendo en cuenta que 



x k 1 y 


n—Jc 


df(x, y) 
dx 


n(x + y) n ~ x . 


Si multiplicamos ambos miembros de esta ultima ecuacidn por x y ponemos x - n 
e y = q, obtenemos E(X) = np. y 

Mediante un argumento similar podemos deducir la formula 


Var (X) =^(k - npf 

k =0 


p k q 


n—k 


= npq. 


En el ejercicio 6 de la seccion 14.27 se pide la demostracion de esta fdrmula. 

ejemplo 3. Distribution normal. Las palabras «media» y «varianza» ya 
iueron introducidas al describir la distribucion normal en la seccion 14.14. Tales 
denominaciones se justifican mediante las formulas 


E(X) = ( +CO te-«‘-”"'^d t = m 

OyJlTt J -oo 

y 

(t - dt = a 2 . 

-oo 


Var 


W = —7= I 

ajln J 


En el ejercicio 7 de la seccion 14.27 se piden las demostraciones de esas formulas. 

Los jugadores emplean con frecuencia el concepto de esperanza para decidir 
si un determinado juego de azar es favorable o desfavorable. Como ejemplo vamos 
a considerar el juego de apostar sobre el «rojo» o el «negro» en la ruleta. 


ejemplo 4. Ruleta. Una ruleta recorre los numeros del 0 al 36. El 0 aparece 
sobre el fondo gris, la mitad de los 36 numeros restantes sobre fondo rojo y la 
otra mitad sobre fondo negro. Los metodos corrientes de apuestas son: 

1) Apostar 1 $ sobre un color (rojo o negro). Ganancia posible: 2 $. 

2) Apostar 1 $ a un solo numero (excluido el 0). Ganancia posible: 36 $. 

3) Apostar 1 $ a una docena cualquiera de numeros (0 excluido) Ganan¬ 
cia posible: 3 $. 


Si sale el 0 la casa gana y todos los demas jugadores pierden. 

Sea X la variable aleatoria que mide la ganancia que se consigue apostando 
con el metodo 1). Los posibles valores de X son Xi = — 1 y x 2 = + 1. Las pro- 
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babilidades son P(X = x-i) = 19/37, P(X = x 2 ) = 18/37. Por lo tanto, la espe¬ 
ranza es 


E{x) = (-i)lf + (+i)if = -TT; 

este resultado se interpreta corrientemente como que el juego es desfavorable para 
todo el que participa en el. La justificacion matematica de esta interpretation se 
consigue con una de las leyes de los grandes numeros, que se discuten en la sec- 
cion 14.29. El lector puede comprobar que la esperanza tiene el mismo valor 
usando los metodos de apuesta 2) y 3). 

ejemplo 6. Un juego de cara y cruz. En un juego de cara y cruz hay una 
probabilidad p de que saiga cara (H) y una probabilidad q de que saiga cruz (T), 
siendo O^p^l y q = l — p. Se lanza la moneda sucesivamente hasta que 
vuelva a aparecer por segunda vez el primer resultado que se obtuvo; entonces 
termina el juego. Si el primer resultado es H el jugador gana 1 $ por cada T que 
saiga hasta que volvamos a obtener H. Por ejemplo, si HTTTH gana 3 $, en cam- 
bio, si HH gana 0 $. Si el primer resultado es T se aplica la misma regia de juego 
cambiando H por T. El problema consiste en determinar cuanto deberia pagar un 
jugador para participar en este juego. A tal fin consideramos la variable aleatoria 
que cuenta el numero de dolares ganados por el jugador y calcularemos su espe¬ 
ranza. 

Como espacio muestral tomamos la coleccion de todas las posibles partidas 
que pueden jugarse. Tal conjunto puede expresarse como la reunion de dos con- 
juntos Ay B, donde 

A = {TT, THT, THHT, THHHT ,...} y B = {HH, HTH, HTTH, HTTTH ,...}. 

Los elementos del conjunto A (en el orden citado) los designamos por a 0 , (h, a 2 ,... 
y los del conjunto B por b 0 , bi, b 2 ,... Seguidamente asignamos las probabilida- 
des, como sigue: 


P(a n )=p n q 2 y P(b n ) = q n p 2 . 

(Cuando p — 0, ponemos P(a 0 ) = 1 y P(x) = 0 para cualquier otro x de A u B. 
Cuando q = 0, ponemos P(b 0 ) = 1 y P{x) — 0 para todos los demas x.) En la sec- 
cion 13.21 se demostro que esta asignacion de probabilidades es aceptable. 

La variable aleatoria X que nos interesa se define sobre el espacio muestral 
A U B como sigue: 


X(a n ) = X{b n ) = n para n = 0, 1, 2,- 
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El suceso «X = n» consta de las dos partidas a„ y b„, as! que tenemos. 


P(X = n) = p"q 2 + q n p i , 

donde p" y q° se consideran 1 cuando p = 0 o q = 0. La esperanza de X viene 
dada por la suma 

QO 00 oo 

(14.40) EW^^nPiX = n) = q^np 71 + P*lnq n ■ 

n=0 7i=0 7i=0 


Si p — 0 o q — 0, obtenemos E(X) — 0. En los demas casos podemos calcular las 
sumas de las series (14.40) observando que para 0 < x < 1 tenemos. 





(1 - x) 2 ' 


Aplicando este resultado en (14.40) haciendo x = p y x — q obtenemos nara 
0<P<1, 


£(*) = 


- d P 


+ 


p 2 q 


(1 - p) 2 (1 - q) 


= p + q == 1. 


Interpretamos este resultado diciendo que el juego es desfavorable para los que 
pagan mas de 1 $ para participar en el. 

Este ejemplo tiene especial interes porque la esperanza E(X) es independiente 
de p cuando 0 < p < 1. En otros terminos, «cargando» la moneda a favor de cara 
o de cruz no se altera el valor esperado salvo en el caso extremo en el que se 
haya «cargado» la moneda de tal modo que nunca saiga cara o que nunca saiga 
cruz. Notese que, como funcion de p, la esperanza E(X) es discontinua en los 
puntos P = 0 y p = 1. En los demas tiene el valor constante 1. Este interesante 
ejemplo fue sugerido al autor por H. S. Zuckerman. 

14.26 Esperanza de una funcion de una variable aleatoria 

Si se relaciona una nueva variable aleatoria Y a la X mediante una ecuacion 
de la forma Y = <p(X), su esperanza (en el caso continuo) viene dada por 


(14.41) 


E(y ) = IT'/fO) dt. 


La esperanza E(Y) puede calculate directamente en funcion de la densidad f x sin 
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tener que detcrminar la densidad de Y. Efectivamente, la siguiente formula es 
equivalente a (14.41): 

(14-42) E(Y) = J * * q{t)f x {t) dt. 

La demostracion de (14.42) en el caso mas general es difi'cil y no la intentaremos 
aqui. No obstante, la demostracion para muchos casos particulares interesantes es 
sencilla. En estos, q 1 es derivable y estrictamente creciente sobre todo el eje 
real. Para una variable aleatoria de distribucion continua X con densidad f x tene- 
mos la formula siguiente .para la densidad /y (deducida en la scecion 14.17): 

frO) = /yW 01 ‘ y'fO. 

siendo la inversa de q. Si aplicamos esto en (14.41) y efectuamos el cambio de 
variable u — [de modo que t = <p(u)], obtenemos 


f +CO f+ co oo 

E ( Y ) = J_ w '/kW dt = J_ x tfAf(t)] ■ V>\t) dt = J_ a q(u)f x {u) du , 

que coincide con (14.42). 

Cuando la igualdad (14.42) se aplica a Y = (X — m) 2 , siendo m = E(X), 
obtenemos 

r f co 

E(E) = J ^ (t — m) 2 f x (t)dt = Var (X). 

Esto demuestra que la varianza es a su vez una esperanza. Tambien en el caso 
discreto es valida una formula analoga a la (14.42). Con mayor generalidad, puede 
demostrarse que 

r+ao r+co 

E W X 1 Y)] = J_ W qp(x, y)f(x, y) dx dy 

si (X, Y) es una variable aleatoria continua con densidad conjunta /. 

Observation. Para las variables aleatorias bidimensionales, la esperanza y la 
varianza pueden definirse en forma analoga a la empleada en el caso unidimensional, 
salvo que se emplean integrales y sumas dobles. 


14.27 Ejercicios 

1. Se lanza un dado. Representemos con X el numero de puntos conseguido. Calcular 
E(X) y Var(X). 

2. Supongamos que X es una variable aleatoria continua con una cierta funcion de densi- 
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dad. Sea Y = (X - m)/o, donde m = £(X) y a = ^/Var W. Demostrar que £(7) = 0 

y £(7 2 ) = 1. 

3. Deducir las siguientes propiedades generales de la esperanza y de la varianza para los 
casos tanto discretos como continuos. 

a) E(cX) = cE(X ), donde c es una constante 

b) Var (cX) = c 2 Var (X ), donde c es una constante 

c) E(X + 7) = E(X) + E(Y). 

d) Var {X) = E(X 2 ) - [E(X)f. 

e) Var (X + Y) = Var (X) + Var ( Y) + 2E[(X - E(X))( Y - E{ 7))]. 

f) Elqj^iX) + <p a (7)] = Eiy^X)] + E[q> 2 {Y)]. [El apartado c) es un caso particular.] 

4. Si X e Y son variables aleatorias independientes, demostrar que 

a) Var (X + Y) = Var (V) + Var (y). 

b) E[VW ■ v(y>] = E[<p(X)} ■ £[ V (7)]. 

c) Si X\, X->, ..., X„ son variables aleatorias independientes con E(X k ) = m k , demos¬ 
trar que 


Var 


2 ~ 


Dc=l 


= 2 Var (X k - m k ) = £ Var (X k ). 


1 


fc«= 1 


5. Sean Xi, X 2 ,..., X„ n variables aleatorias independientes, con esperanzas iguales, 
E(X k ) = m. y la misma varianza, Var (X k ) = a-. Sea X la media aritmetica, X = 
= (l/n)2S=i Xi. Aplicar los ejercicios 3 y 4 para demostrar que E(X) — m y 
Var (X) = < 7 2 /n. 

6. a) Si q = 1 — p, demostrar la formula, 


2 (* - n P^{^\p k( i n ~ k = 

k=0 ' ' 


probando asi que Var (X) = npq para una variable aleatoria X que tenga distribucion 
binomial con parametros n y p. [ Indication: k- — k(k -1)4- k.\ 

b) Si X tiene distribucion binomial con parametros n y p, demostrar que puede expre- 
sarse como suma de n variables aleatorias independientes Xi, X 2 ,.. •, X„, tomando cada 
una los valores posibles 0 v 1 con probabilidades p y q respectivamente, y con dis¬ 
tribucion binomial. Utilizar este resultado y el ejercicio 5 para demostrar que £(X) = np 
y Var (X) = npq. 

7. Determinar la esperanza y la varianza (cuando existan) para una variable aleatoria X 
que tenga 

a) distribucion de Poisson con parametro X. 

b) distribucion de Cauchy. 

c) distribucion exponencial con parametro X. 

d) distribucion normal. 

8. Una variable aleatoria X tiene una funcion densidad dada por 


/0) = ~ si UI>1, /(f) = 0 si |/U 1, 
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siendo r > 1 y C(r) es independiente de t. 

a) Expresar C(r) en funcion de r y hacer un diseno para indicar la naturaleza de la 
grafica de /. 

b) Determiner la correspondiente funcion de distribucion F x e indicar la naturaleza 
de su grafica. 

c) Calcular P(X < 5) y P( 5 < X < 10) en funcion de r. 

d) i Para que valores de r tiene X una esperanza finita? Calcular E(X) en funcion de r 
cuando sea finita. 

e) i,Para que valores de r tiene X varianza finita? Calcularla en funcion de r cuando 
sea finita. 

9. Un jugador de ruleta lo hace de acuerdo con el siguiente «sistema». Juega en series 
de tres tiradas. En la primera y segunda tiradas apuesta siempre 1 $ en rojo. Para la 
tercera tirada precede asi: 

a) Si gano en la primera y en la segunda, no apuesta. 

b) Si gano en la primera o en la segunda perdiendo en la otra, apuesta 1 $ en color 
opuesto al que ha salido en la segunda tirada. 

c) Si perdio en las dos primeras, apuesta 3 $ al rojo. 

Sean X, Y y Z los resultados (en dolares) de la primera, segunda y tercera tiradas res- 
pectivamente. Calcular E(X), E(Y), E(Z) y E(X + Y + Z). 

10. (Problema de Petersburgo). Un jugador lanza una moneda y gana 1 $ si a la primera 

tirada sale cara. Si otra vez sale cara gana otro dolar. Si vuelve a salir cara en la ter¬ 
cera tirada gana 2 $ (en total ha ganado 4 $). Si obtiene una sucesion de n caras con- 

secutivas su ganancia acumulada es de 2"~' dolares. El juego termina cuando sale cruz. 
Sea X el numero de dolares ganados en una determinada tirada. Calcular E(X). Visto el 
resultado, c’.cuanto ha de pagar un jugador a una casa de juego para poder tomar parte 
en un juego con las reglas anteriores? 

11. a) Supongamos que X es una variable aleatoria continua con densidad f x . Sea 

Y = (X — m)/a, donde m = E(X) y a = V Var (X). Demostrar que 


E(e v ) =<*-»/„ (_ + J J e t,(T f x (t)dt. 


b) Sea X una variable aleatoria discreta con distribucion de Poisson de parametro X. 
Definir Y como en la parte a) y demostrar que 

E(e Y ) = e ~ XGU) , donde G(A) = 1 + _L _ e v^. 

Va 

12. Una variable aleatoria X t iene distri bucion normal canonica. Calcular: a) E(\X\), 
b) E(e x ), c) Var(e*), d) £( V X 2 + Y-). En la parte d), Y tambien tiene distribucion 
normal canonica, pero es independiente de X. 


14.28 Desigualdad de Chebyshev 

Como ya se menciono, un valor pequeno de la varianza significa que es poco 
probable que una variable aleatoria X se desvfe mucho del valor esperado. Para 
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precisar mas esta afirmacion introducimos el valor absoluto |X — E(X)[ que mide 
la distancia entre X y £(X). iQue probabilidad hay de que esa distancia supere 
a un determinado numero? Para contestar esta pregunta tenemos que determinar 
la probabilidad 


P[\X-E(X)\>c], 


donde c es un numero positivo dado. En el caso continuo tenemos 


P[\X - E{X)\ > c] = 


(14.43) 


1 - P[\X - E(X) | < c] = 1 - P[E(X) -c<X< £(X) + 

<•+«> rE{X)+c 

L-MOX'-J 

rE(x)—c r+°° „ , . , 


c] 


por consiguiente, el calculo de esa probabilidad puede llevarse a efecto tan pronto 
se conozca la densidad fx- Naturalmente, si fx es incognita este metodo no nos da 
informacion alguna. No obstante, si la varianza se conoce, podemos obtener una 
cota superior en (14.43). Tal cota superior nos la proporciona el siguiente teorema 
de P. L. Chebyshev (1821-1894), famoso matematico ruso que aporto notables 
contribuciones al Calculo de probabilidades y a otras ramas de la Matematica, en 
especial a la Teona de numeros. 


teorema 14.11. desigualdad de chebyshev. Si X es una variable alea- 
toria unidimensional con esperanza finita E(X) y con varianza Var (X), entonces 
para todo numero positivo c tenemos 

(14.44) P[| X-E(X)\>c]< . 


Demostracion. En el caso continuo tenemos: 

Var (X) = I” ” [t — E(X)] 2 fx(t) dt 

V—OO 

P'p'(Y’) c /*+°0 

> J_ [t - E(X)ff x (t) dt + J £( Y)+c [t - E(X)ff x (t) dt 

„/rE(X)-c r+™ . 

^ C (/_„ fxV) dt + L(X)+c fx(t) dt ) • 

En virtud de (14.43), el coeficiente de c 2 en el segundo miembro es 
P[jX—£(X)i>c]. Por consiguiente, dividiendo por c 2 obtenemos (14.44). El caso 
discreto puede tratarse en forma semejante. 
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La desigualdad de Chebyshev nos dice que cuanto mayor sea c tanto menor 
serd la probabilidad de que |X — E(X)| > c. Dicho de otro modo, no es probable 
que Xsedesvie mucho del valor £(X); lo mismo ocurre si la varianza Var(X) es 
pequena. 

Si reemplaza rnos c por k<r, sicndofc > 0 y a representa la desviacion tipica 
[<r = V Var(X)], la desiguadad de Chebyshev se convierte en 

P[\X - E(X)\> ka]< ] -. 

Esto es, la probabilidad de que X difiera de su valor esperado mas de k veces la 
desviacion tipica no excede de 1 /k 2 . Por ejemplo, cuando k — 10 esa desigualdad 
nos dice que la probabilidad P[|X — £(X)j > 10a] no excede a 0,010. Es decir, 
la probabilidad de que un valor observado de X difiera del valor esperado en mas 
de 10 veces la desviacion tipica, no supera a 0,010. Analogamente, cuando k — 3 
encontramos que la probabilidad de que un valor observado difiera de la media en 
mas de tres veces la desviacion tipica, no supera a 0,111. 

La desigualdad de Chebyshev es un teorema general que se aplica a todas 
las distribuciones. En muchas aplicaciones, cuando se tiene mas informacion acerca 
de la distribucion que se considera, se puede mejorar esa desigualdad. Por ejemplo, 
si X tiene distribucion binomial con parametros n y p se puede demostrar (utili- 
zando la aproximacion normal de la distribucion binomial) que para valores gran¬ 
des de n la probabilidad de que un valor observado difiera de la medida en mas 
de tres desviaciones tipicas es proxima a 0,003. (Para este resultado, basta n - 12.) 
Esta probabilidad es mucho mas pequena que la 0,111 conseguida con la desigual¬ 
dad de Chebyshev. 

ejemplo. Comprobacion de una moneda. Deseamos comprobar si una mone- 
da es «correcta» o no, lanzandola 10 000 veces y registrando el numero de caras. 
Para una moneda «correcta» la variable aleatoria X que cuenta el numero de caras 
tiene distribucion binomial con parametros n = 10 000 y p = 1 / 2 - La media de 
X es np = 5 000 y la desviacion tipica es <x = V npq = 50.(Vease el ejemplo 2 
en la seccion 14.25). Como antes se dijo, la probabilidad para que una variable 
aleatoria con distribucion binomial difiera del valor esperado en mas de 3cr es apro- 
ximadamente 0,003. Por lo tanto, convendremos en decir que una moneda «no es 
correcta» si el numero de caras en 10 000 tiradas difiere de la media en mas de 3tr. 
Puesto que £(X) = 5 000 y 3<r = 150, podriamos afirmar que la moneda «no es 
correcta» si el numero de caras en 10 000 tiradas es menor que 4 850 o mayor 
que 5 150. 

14.29 Leyes de los grandes numeros 

A1 hablar de problemas de monedas, se dice a menudo que la probabilidad de 
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que saiga cara con una moneda perfectamente equilibrada es 1 / 2 - Esto no significa 
que si una moneda se lance dos veces saiga necesariamente cara una sola vez. 
Ni que en 1 000 tiradas salgan exactamente 500 caras. Representemos con h(n) 
el numero de caras que se presentan en n tiradas. La experiencia nos demuestra 
que incluso para n muy grande, la razon h(n)/n no es necesariamente x / 2 . No obs¬ 
tante, la misma experiencia nos dice que esa razdn parece aproximarse a V 2 cuando 
n crece, si bien puede oscilar considerablemente en torno a x / 2 durante el proceso. 
Esto nos sugiere la posibilidad de demostrar que 

(14.45) lim 

n~* oo n 2 

Desgraciadamente, esto no es posible. Una de las dificultades es que el numero 
h{n) depende no tan solo de n, sino tambien de la ejecucion del experimento. No 
tenemos medio de conocer de antemano como varia h(n) de un experimento a otro. 
Pero la dificultad real es que es posible (aunque no muy probable) que en alguna 
determinada experiencia la razdn h(n)/n no tienda a x / 2 en absoluto. Por ejemplo, 
no hay razdn para excluir la posibilidad de que saiga cara en todas las tiradas de 
la moneda, en cuyo caso h(rt) = n y h(n)/n 1. Por consiguiente, en lugar de 
intentar la demostracion de la formula (14.45), encontraremos mas razonable (y 
mas util) averiguar la probabilidad de que h(_n)/n difiera de x / 2 en una cierta can- 
tidad. Dicho de otro modo, dado un cierto numero positivo c, determinar la pro¬ 
babilidad 


P 


( 


m 

n 



Introduciendo una conveniente variable aleatoria y aplicando la desigualdad de 
Chebyshev podemos conseguir una cota superior util de esa probabilidad, una cota 
que no exige un conocimiento explicito de h(n). Esto nos lleva a un nuevo lfmite 
que reemplazara en forma adecuada al (14.45), 

No exige gran esfuerzo tratar el caso mas general de una sucesion de pruebas 
de Bernoulli, en la que la probabilidad de «exito» o «suceso favorable» sea p y 
la de «fallo» o «suceso contrario» sea q. (En el lanzamiento de la moneda, el 
«exito» sera por ejemplo «cara» y tomamos p = %•) Sea X la variable aleatoria 
que cuenta el numero de sucesos favorables en n pruebas independientes. En tal 
caso X tiene distribution binomial con esperanza E(X) = np y varianza Var(X) = 
= npq. Luego la desigualdad de Chebyshev es aplicable; ella nos dice que 

(14.46) P{\X - np\> c) <^j-' 

Puesto que nos interesa la razdn X/n, que podemos llamar frecuencia relativa del 
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suceso, dividimos la desigualdad \X - np\> c por n y volvemos a escribir (14.46) 
asf 


(14.47) 





Ya que esto es valido para todo c > 0, podemos hacer que c dependa de n y es¬ 
cribir c = en, siendo e un numero positivo fijo. Entonces (14.47) se transforma en 


P 


( 


X 

n 


P 




El hecho de que aparezca n en el denominador del segundo miembro sugiere que 
hagamos tender n a«, Esto nos conduce a la formula 


(14.48) 


lim P(* 

n~* oo \ Tl 


p 



para todo e > 0, fijo. 


que se denomina la ley de los grandes numeros para la distribucidn de Bernoulli 
Ella nos dice que, dado une >0 (por pequeno que sea), la probabilidad de que 
la frecuencia relativa del suceso difiera de p en mas de e es una funcion de n que 
tiende a 0 cuando «-><». Esta relacion nos da una justificacion matematica para 
la asignacion de la probabilidad % al suceso de conseguir cara con una moneda 
perfectamente equilibrada. 

El lfmite (14.48) es un caso particular de un resultado mas general en el que 
la «frecuencia relativa» X/n es reemplazada por la media aritmetica de n varia¬ 
bles aleatorias independientes con la misma esperanza y la misma varianza. Este 
teorema mas general se conoce con el nombre de ley debil de los grandes nume¬ 
ros; puede establecerse asi: 


TEOREMA 14.12. LEY DlJBIL DE LOS GRANDES NUMEROS. Sean X lt X 2 , . . . , X„ 
n variables aleatorias independientes, todas con la misma esperanza y la misma va¬ 
rianza, y scan 

E(X k ) = m y Var (X k ) = a 2 para k = 1,2 

Definamos una nueva variable aleatoria X (llamada media aritmetica de X lt 
X 2 ,.... X„) mediante la igualdad 



n 
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Entonces, para todo e > 0 ,fijo, tenemos 


(14.49) lim P(\X — m\ > e) — 0. 

n~* oo 

Una proposition equivalente es 

(14.50) lim P(| X — m\ < e) = 1 . 

n~* oo 

Demostracion. Aplicamos la desigualdad de Chebyshev a X. Para ello ne- 
cesitamos conocer la esperanza y la varianza de X. fistas son: 

_ _ (X 2 

E(X) = m y Var(A') = —. 

(Vease el ejercicio 5 de la seccion 14.27.) La desigualdad de Chebyshev se con- 
vierte en P(\X — m\ > c) ^ <r z /(nc 2 ). Haciendo que w -» « y sustituyendo c 
por e obtenemos (14.49) y por lo tanto (14.50). 

Observation. Para demostrar que el h'mite (14.48) es un caso particular del teore- 
raa 14.12, supongamos que cada X k tiene los valores posibles 0 y 1, con probabilida¬ 
des P(Xk = 1 ) — p y P(X k = 0) = 1 — p. Entonces X es la frecuencia relativa de 
exito en n pruebas independientes, E(X)= p, y (14.49) se reduce a (14.48). 


El teorema 14.12 se denomina ley debit porque existe tambien una ley fuerte 
de los grandes numeros que (bajo las mismas hipotesis) establece que 

(14.51) p/lim \X — m\ — o\ = 1. 

\n oo / 

La diferencia esencial entre (14.51) y (14.50) es que las operaciones «limite» y 
«probabilidad» estan intercambiadas. Puede demostrarse que la ley fuerte implica 
la debil, pero no al reves. 

Observese que la ley fuerte (14.51) parece ser mas proxima a la (14.45) que 
a la (14.50). En realidad, (14.51) nos dice que lim X = m «casi siempre», es decir, 
con probabilidad 1. En particular, si la aplicamos al juego de cara y cruz, nos dice 
que el que no se cumpla la igualdad (14.45) es menos probable que el conseguir 
siempre cara al lanzar repetidamente una moneda correcta. La ley fuerte pone de 
manifiesto por que la teoria de la probabilidad corresponde a la experiencia y a 
nuestra sensacion intuitiva de lo que «debe ser» la probabilidad. 

La demostracion de la ley fuerte es larga y la omitiremos. Puede verse en las 
obras citadas en las referencias 1, 3, 8 y 10 del final de este capitulo. 
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14.30 El teorema central del llmite 

En muchas aplicaciones del Calculo de probabilidades, las variables aleatorias 
son sumas de otras variables aleatorias. Por ejemplo, el resultado (en dinero) 
despues de varias partidas de juego es la suma de las ganancias en cada una. 
Un hecho sorprendente acontece cuando se suman un gran numero de variables 
aleatorias. Bajo condiciones generales (aplicable casi a todos los casos practicos 
que se presentan) la distribution de la suma tiende a ser normal, prescindiendo de 
las distribuciones de cada una de las variables aleatorias que forman la suma. 
El enunciado preciso de este hecho notable se conoce como el teorema central del 
llmite del Calculo de probabilidades. Lo que explica la importancia de la distribu¬ 
cion normal tanto en la teorfa como en la practica. La discusion completa de este 
teorema pertenece al estudio superior del Calculo de probabilidades. En esta sec- 
cion se explicara solamente lo que afirma el teorema. 

Sea una sucesion indefinida de variables aleatorias, X„ X 2 ,.. ., con esperan- 
zas y varianzas finitas. Sean estas: 

m k — E(X k ) y a 2 k = Var (**.), k= 1,2,.... 

Formamos una nueva variable aleatoria S„ sumando las n primeras diferencias 
X k — m*: 


(14.52) S n =2(X k -m k ). 

k= i 

En lugar de las Xk sumamos las diferencias de manera que la suma S„ tendra por 
valor esperado el 0. El problema consiste en determinar la forma h'mite de la 
funcion de distribucion de S„ cuando n -» °o. 

Si X u X 2 ,.. ., X„ son independientes, tenemos [en virtud del ejercicio 4 c) 
de la seccion 14.27] 


Var (SJ = 2 Var (X k - m k ) = 2 Var (**) = 2 4 


k =1 


fc=l 


Ordinariamente, la Var(S„) sera grande aunque las varianzas particulares a\ sean 
pequenas. Las variables aleatorias con gran varianza no interesan porque sus 
valores tienden a presentar gran dispersion respecto al valor esperado. Por este 
motivo, se introduce una nueva variable aleatoria T„ mediante la formula 


(14.53) 


VVar (S n ) 


Esta variable tiene esperanza 0 y varianza 1 y se llama variable aleatoria reducida. 
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La variable aleatoria reducida T n tiene pleno sentido aun cuando las variables 
X lt X 2 ,..., X„ no sean independientes. 

Introducimos ahora la siguiente definicion: 

DEFINICION DE LA PROPIEDAD CENTRAL DEL LIMITE. Sea 

(14.54) Xi, X 2 , X 3 , . . . 

una sucesion de variables aleatorias (no necesariamente independientes), donde 
cada Xk tiene una esperanza m k y una varianza a\ ambas finitas. Se definen S„ y T„ 
mediante (14.52) y (14.53). Se dice que la sucesion (14.54) satisface la propiedad 
central del limite si, para todo par a y b siendo a ^ b, tenemos 

(14.55) lim P(a < T n < b) = -L I V u ’ /2 du. 

71-+CG \ 2.7T v a 

Dicho de otro modo, las variables aleatorias (14.54) satisfacen la propiedad central 
del limite si la distribucion de la variable reducida T„ se aproxima a una distribu¬ 
cion normal cuando n -» <». [La igualdad (14.55) es valida tambien si d = — oo 
o b — + oo.] 

Laplace fue el primero en comprobar que muchas sucesiones de variables alea¬ 
torias satisfacen esta propiedad, si bien antes De Moivre conocia un caso particular 
(el de variables aleatorias que constituyen una sucesion de pruebas de Bernoulli). 
La figura 14.11 muestra una distribucion binomial y la correspondiente aproxima- 
cion normal. Laplace establecio un teorema central del limite general que fue de- 
mostrado por primera vez en forma completa por el matematico ruso A. Lyapunov 
en 1901. En 1922, J. W. Lindeberg generalizo el resultado de Laplace demostran- 
do que la propiedad se cumple si las variables aleatorias son independientes y 
tienen una distribucion comun con las mismas esperanzas y varianzas, o sea 
E(Xk) = m y Var(X^) = a 2 para todo k. En tal caso la variable reducida es: 

r _ - nm 

o\J n ' 

Lindeberg se dio cuenta de que tan solo la independencia no es suficiente para 
garantizar la propiedad central del limite, pero formulo otra condicion (la condi- 
cion de Lindeberg) que, junto con la independencia es suficiente. En 1935, 
W. Feller demostro que la condicion de Lindeberg es necesaria y suficiente para 
que las variables aleatorias independientes satisfagan la propiedad central del 
limite. Aqui no haremos la discusion de la condicion de Lindeberg, solo mencio- 
naremos que ella implica 


Var ( S n ) —> oo cuando n oo. 
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Afortunadamente, muchas variables aleatorias independientes que en la practica 
se presentan, satisfacen la condition de Lindeberg y por consiguiente tambien la 
propiedad central del limite. Hasta ahora, la teorfa para variables aleatorias depen- 
dientes es incompleta. Tan solo se han tratado unos pocos casos particulares. 
La investigation contemporanea en Calculo de probabilidades en gran parte esta 
centrada en la busqueda de teoremas generates referentes a variables dependientes. 

14.31 Ejercicios 

1. Demostrar la desigualdad de Chebyshev en el caso discreto. 

2. Si a es un numero real cualquiera, demostrar que 

P{\X -a\> C X) <S \ 
c 4 

para todo c > 0, siendo X 2 = Ji” (t— a) 2 f x (t)dt. La desigualdad de Chebyshev es el 
caso particular en el que a = E(X). 

3. Sea X la variable alealoria que cuenta el numero de exitos en n pruebas independientes 
de una sucesion de Bernoulli; la probabilidad de exito es p. Demostrar que, para todo 
« > 0 , 




4. Se lanza n veces una moneda «correcta»; el numero de caras se representa por X. En- 
contrar el menor valor de n para el que la desigualdad de Chebyshev implique 

.6 j >0.90. 

5. En una cadena de produccion el numero X de articulos manufacturados defectuosos en 
una determinada hora se sabe que tiene una distribucion de Poisson con media 
E(X) = 100. Emplear la desigualdad de Chebyshev para calcular una cota inferior para 
la probabilidad de que en una hora determinada los articulos defectuosos producidos 
este comprendidos entre 90 y 110. 

6 . Supongamos que una variable aleatoria X tenga una distribucion normal canonica 
(media 0 y varianza 1). Representemos con p la probabilidad de que X difiera de su es- 
peranza E(X) en mas de tres veces la desviacion tipica. Aplicar la desigualdad de 
Chebyshev para encontrar una cota superior de p. Seguidamente, usando las corres- 
pondientes tablas de la distribucion normal, comprobar que hay una cota superior de p 
que es aproximadamente igual a un cincuentavo de la obtenida por la desigualdad de 
Chebyshev. 

7. Dada una sucesion de variables independientes Xi,X», ■ ■ ■ ,con distribucion normal cada 
una. Sean nit = E(Xt) y = Var(TG). Probar que tal sucesion tiene la propiedad cen¬ 
tral del limite. [Indication: Recuerdese el ejercicio 7 de la seccion 14.24.] 

8. Sean las variables aleatorias independientes Xi,X 2 ,.... con la misma distribucion bino¬ 
mial. Supongamos que cada Xt toma los valores 0 y 1 con probabilidades P(Xt = 1) = p 
y P[X k — 0) = q, siendo p + q = 1. La variable aleatoria Z„ = Xi + X-> + ... + X„ 
cuenta el numero de exitos en n pruebas de Bernoulli. 


/ x 
PI 0.4 < — < 0 
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a) Dcmostrar que la propicdad ccnlral del h'mite toma la forma siguiente: 


lim pi 7 "'' 1 ’ < r) = —L f e~ ulli du. 
ii —►co \ sjnpq 1 yjln J~a.> 

b) Usar la aproximacion sugerida en la parte a) para cslimar la probabilidad de oble- 
ner un numero de caras comprendido enlre 45 y 55 si se lanza 100 veees una moneda 
correeta. Reeurrir a tablas de distribueion normal para realizar el ealeulo. 

9. Con la notacion del ejercicio 8, el teorema central del h'mite para variables aleatorias 
que forman una sucesion de pruebas de Bernoulli puede escribirse en la forma 


lim 

II— co 


p 


1 1 < 


Zn - "P 
sfnpq 


< ^2 


®('2) - <l, (fl) 


= 1 , 


donde <1> es la distribueion normal canonica. En este caso particular puede demostrarse 
que la formula tambien es valida cuando 6 y t-< son funciones de n dadas por 
t { = (a — np)/sj~hpq y t> = (b — np)fs! npq, donde a y b son constantes positivas pre- 
fijadas, a < b. 

a) Dcmostrar que esta relacion implica la formula asintdtica 

\ yj npq 1 \ V npq / 

b) Se lanza un dado insesgado o correcto 180 veees. Usar la aproximacion sugerida en 
la parte a) para estimar la probabilidad de que saiga un seis exactamente 30 veees. Para 
los calculos hacer uso de las tablas de distribueion normal 14.1. 

10. Se lanza un dado insesgado o correcto 100 veees. Utilizar la aproximacion sugerida en 
el ejercicio 9 a) para estimar la probabilidad de que saiga un seis a) exactamente 25 ve- 
ces, b) por lo menos 25 veees. Para los calculos utilizar tablas de distribueion normal. 
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INTRODUCTION AL ANALISIS NUMERICO 


15.1 Introduccion historica 

El planeta Urano fue descubierto en 1781 por un inteligente astronomo afi¬ 
cionado, William Herschel (1738-1822), con un telescopio de fabricacion casera. 
Teniendo en cuenta las leyes de Kepler, la prevista orbita de Urano fue rapida- 
mente calculada a partir de unas pocas observaciones muy separadas entre sf. Se 
encontro que la distancia media de Urano al Sol era aproximadamente el doble 
que la de Saturno y que una orbita completa requerirfa 84 anos. En 1830 los datos 
empfricos acumulados pusieron de manifiesto desviaciones inexplicables de la 
orbita prevista. Algunos astronomos llegaron a pensar que la ley de la gravitacion 
universal de Newton no fuera valida para distancias tan grandes como la de Urano 
al Sol; otros sospecharon que las perturbaciones fueran debidas a un cometa aun 
no descubierto o a un planeta mas lejano. 

Un estudiante del bachillerato de la Universidad de Cambridge, John Couch 
Adams (1819-1892), estaba intrigado por la posibilidad de un planeta descono- 
cido. Se asigno la diffcil tarea de calcular la influencia de un tal planeta en las 
posiciones observadas de Urano, suponiendo valida la ley de gravitacion de New¬ 
ton. Completo su calculo en 1845 e insto al Real Obseryatorio de Greenwich a 
buscar el supuesto planeta, pero su requerimiento no fue tornado en serio. 

Independientemente y casi simultaneamente Jean Joseph Leverrier (1811- 
1877) de Paris, realizo un calculo parecido y pidio a Johann Galle, jefe del Obser- 
vatorio de Berlin, que confirmara su prediccion. La misma noche que recibio la 
carta de Leverrier, Galle encontro el nuevo planeta, Neptuno, casi exactamente 
en la posicion calculada. Este fue otro triunfo de la ley de gravitacion de Newton, 
y uno de los primeros grandes triunfos del analisis numerico, el arte y la ciencia 
de calcular. 

La historia del analisis numerico data de tiempos antiguos. Los babilonios, 
2000 anos a.J., compusieron tablas matematicas. Se ha encontrado una tablilla 


695 



696 


Introduction al analisis numerico 


de barro con los cuadrados de los enteros del 1 al 60. Los babilonios adoraban 
los cuerpos celestes y elaboraban efemerides astronomicas. El famoso astronomo 
alejandrino Claudio Ptolomeo (aproximadamente 150 d.J.) posei'a unas efemeri¬ 
des babilonicas de eclipses que databan del ano 747 a.J. 

Arquimedes, en el ano 220 a.J., uso los poligonos regulares como aproxima- 
ciones del circulo y dedujo las desigualdades 3 1( !-i < x < 5>4. El trabajo de 
calculo numerico desde entonces hasta el siglo xvn fue centrado principalmente 
en la preparacion de tablas astronomicas. El advenimiento del Algebra en el 
siglo xvi produjo una renovada actividad en todas las ramas de la Matematica, 
incluyendo el analisis numerico. En 1614, Neper publico la primera tabla de loga- 
ritmos, y en 1620, los logaritmos de las funciones seno y tangente fueron tabuladas 
con siete cifras decimales. Hacia 1628 habian sido calculadas tablas de logaritmos 
con catorce decimales de los numeros 1 al 100 000. 

El calculo con series empezo a florecer hacia fines del siglo xvii, con el de- 
sarrollo del calculo. A principios del siglo xvm Jacob Stirling y Brook Taylor 
sentaron los fundamentos del calculo de dijerencias jinitas, que ahora desempena 
un papel central en el analisis numerico. Con la prediccion de la existencia y la 
localizacion del planeta Neptuno por Adam y Leverrier en 1845, la importancia 
cientifica del analisis numerico quedo establecida de una vez para siempre. 

A fines del siglo xix, el empleo de las maquinas de calculo automatico esti- 
mulo aun mas el desarrollo del analisis numerico. Tal desarrollo ha sido explosivo 
desde la terminacion de la segunda Guerra Mundial a causa del progreso en las 
maquinas de calculo electronicas de alta velocidad. Las nuevas maquinas han 
hecho posibles gran numero de importantes logros cientfficos que antes parecian 
inaccesibles. 

El arte de calcular (distinto de la ciencia de calcular) da gran importancia a 
la elaboracion minuciosa del plan que se necesita en un determinado calculo. Tam¬ 
bien trata cuestiones tales como, la precision y exactitud, los errores, y la com- 
probacion. Este aspecto del analisis numerico no lo vamos aqui a discutir; se 
aprende mejor al efectuar los calculos numericos en problemas concretos. Para 
tener un buen conocimiento de los metodos practicos y tecnicos a seguir, el lector 
deberfa consultar los libros que existen sobre analisis numerico, algunos de los 
cuales se citan en la Bibliografia al final de este capftulo. La bibliografia contiene 
tambien algunas de las tablas matematicas mas usadas, muchas de las cuales dan 
tambien informacion practica de como hay que proceder en un calculo deter¬ 
minado. 

Este capftulo es una introduccion a la ciencia del calculo. Contiene algunos 
de los principios matematicos basicos que precisa quien maneja el analisis nume¬ 
rico, tanto si trabaja en gabinete o con una maquina calculadora de alta velo¬ 
cidad. Aparte de su valor practico, la materia de este capftulo tiene interes por 
derecho propio, y es de esperar que esta breve introduccion estimulara al lector 
a profundizar mas en esta importante y fascinante rama de la Matematica. 
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15.2 Aproximaciones por polinomios 

Una idea basica en analisis numerico es la de utilizar funciones sencillas, de 
ordinario polinomios, para aproximar una funcion dada /. En el volumen I se vio 
un tipo de polinomio de aproximacion al tratar de la formula de Taylor (teore- 
ma 7.1). El problema fue entonces encontrar un polinomio P que coincidiera con 
una funcion dada / y con algunas de sus derivadas en un punto dado. Se demos- 
tro que si / es una funcion con derivada de orden n en un punto a , existe un poli¬ 
nomio P y solo uno, de grado — n que satisface las n + 1 relaciones 


P(a)=f(a), P\a)=f\a), ..., P^{a) =/*»(«). 

La solucion viene dada por el polinomio de Taylor, 


p( X ) = 2 - 


k\ 




Tambien se discutio el error que se comete aproximando /(x) por P(x) en puntos x 
distintos del a. Tal error se define por la diferencia E n (x) = fix) - P(x), de 
modo que podemos escribir 


f M (a) 

f(x) =>= L 7 ^ i (^ - a)* + E n (x). 

to kl 

Para estudiar mas profundamente el error necesitamos mayor informacion acerca 
de la funcion f. Por ejemplo, si / posee derivada de orden n + 1 continua en un 
cierto intervalo que contenga a, entonces para todo x de ese intervalo el error 
puede expresarse en forma de integral o como una derivada de orden n + 1 : 

E n (x ) = -\ (x - f) n / ,n+1, 0) dt = f—^ (X - n)" +1 , 

n\ Ja (n + 1)! 

siendo c un punto situado entre a y x. (Ver secciones 7.5 y 7.7 del volumen I.) 

Existen muchos otros metodos para aproximar una funcion dada / mediante 
polinomios, dependiendo del uso que debe hacerse de la aproximacion. Por ejem¬ 
plo, en lugar de querer hallar un polinomio que coincida con / y con algunas de 
sus derivadas en un punto dado, podemos desear un polinomio que tome los 
mismos valores que / en un cierto numero de puntos distintos. Concretamcnte, si 
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los puntos dados son x 0 , x lt ..., x„ podemos buscar un polinomio P que satisfaga 
las condiciones 

(15.1) P(x 0 )=f(x 0 ), P(x 1 )=nx 1 ), ..., P(x n ) = /(*„). 

Puesto que hay n + 1 condiciones a satisfacer intentamos resolver el problema 
con un polinomio de grado ^ n, sea este 

P(x) =J,a k x k , 

k=0 


con n + 1 coeficientes a 0 ,a lt ... ,a„ a determinar. Las n + 1 condiciones (15.1) 
nos conducen a un sistema de n + 1 ecuaciones de primer grado entre los coefi¬ 
cientes. Segun la teorfa de las ecuaciones lineales puede demostrarse que este sis¬ 
tema tiene una y una sola solution; luego el citado polinomio existe siempre. Si 
el sistema se resuelve por la regia de Cramer, los coeficientes a 0 , a lt ... ,a» se 
expresan como cocientes de determinantes. En la practica, no obstante, el polino¬ 
mio P rara vez se determina de este modo debido a que los calculos son extrema- 
damente laboriosos cuando n es grande. Se han desarrollado metodos mas senci- 
llos para calcular los polinomios de aproximacion. Algunos de ellos seran discutidos 
en secciones posteriores. El polinomio que resuelve el problema antes citado se 
llama polinomio de interpolation. 

Otro tipo corriente de polinomio de aproximacion es el llamado de aproxi- 
macion por minimos cuadrados. En este caso, la funcion dada / esta definida y es 
integrable en un intervalo [a, b] y buscamos un polinomio P de grado ^ n tal que 
el error cuadratico medio 


r lf(x) - P(x)l 2 dx 

•’ a 

sea lo menor posible. En la seccion 15.4 demostraremos que para una funcion con- 
tinua / tal polinomio existe y es unico. Los polinomios de Legendre introducidos 
en la seccion 1.14 desempenan un papel fundamental en la resolucion de ese 
problema. 

15.3 Aproximaciones polinomicas y espacios lineales nonnados 

Los distintos tipos de aproximacidn por polinomios descritos en la seccion 
anterior estan relacionados por medio de una idea central que se describe mejor 
con la nomenclatura de los espacios lineales. 

Sea V un espacio lineal de funciones que contiene todos los polinomios de 
grado ^ n y que tambien contiene la funcion / que debe aproximarse. Los poli¬ 
nomios constituyen un subespacio S de dimension finita, siendo dim S = n + 1. 
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Cuando hablamos de la aproximacion de / mediante un polinomio P de S, consi- 
deramos la diferencia / — P, que llamamos error de la aproximacion, y tratamos 
entonces de encontrar un metodo para medir la magnitud de ese error. 

Si V es un espacio euclideo, tiene un producto interior (x, y) y una corres- 
pondiente norma dada por ||x|j = (x,x)' /l , y podemos usar la norma ||/ — P\\ 
como medida del tamano del error. 

Algunas veces pueden introducirse normas en espacios lineales no euclideos, 
esto es, en espacios lineales desprovistos de producto interior. Tales normas se 
introdujeron en la seccion 7.26. Repetimos aqui la definition. 

definici6n de norma. Sea V un espacio lineal de funciones. Una funcion 
real N definida en V se llama norma si tiene las propiedades siguientes: 

a) N(f) — 0 para cada f de V. 

b) N(cf) = \c\N(f) para cada f de V y cada numero real c. 

c) N(f + g) - N(f) + N(g) para todo par de funciones f y g de V. 

d) N(f) = 0 implica / = 0. 

Un espacio lineal con una norma asignada se denomina espacio lineal normado. 

Algunas veces la norma de / se representa por ||/|| en lugar de N(f). Con esta 
notation, las propiedades fundamentales se escriben: 

a) ll/ll ^ 0, 

b) Ik/ll = \c\ ll/ll, 

c) 11/ + gll * ll/ll + llgll. 

d) ||/|| = 0 implica / = 0. 

Una funcion N que satisface las propiedades a), b) y c), pero no la d), se 
llama seminorma. Algunos problemas de la teoria de la aproximacion tratan con 
espacios lineales seminormados; otros con espacios lineales normados. Los ejem- 
plos siguientes se discutiran en este capitulo. 

ejemplo 1. Seminorma de Taylor. Para un entero fijo n ^ 1, sea V el con- 
junto de todas las funciones que poseen derivada de orden n en un punto fijo a. 
El conjunto V es un espacio lineal. Si f e V, sea 

k =0 

Es facil comprobar que la funcion N asi definida es una seminorma. No es una 
norma porque N(f) = 0 si y solo si 

f(a)=f\a) = •••=/<">(«) = 0, 

y esas ecuaciones pueden satisfacerse con una funcion no nula. Por ejemplo, 
N(f) = 0 cuando f(x) = (x — a) n+1 . 
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ejemplo 2. Seminorma de interpolation. Sea V el espacio lineal de todas 
las funciones reales definidas en un intervalo [a, b~\. Para un conjunto fijo de 
n + 1 puntos distintos x 0 , x x . x n de [a,b],definamos N mediante la ecuacion 

*(/)=! !/(**)! 

si f e V. Esta funcion N es una seminorma en V. No es una norma porque 
N(f) = 0 si y solo si f(x 0 ) — f(x l ) — ... — f(x„) = 0, y es evidente que esas ecua- 
ciones se pueden satisfacer con una funcion / no nula en [a, b], 

ejemplo 3. Norma cuadratica. Sea C el espacio lineal de las funciones con- 
tinuas en un intervalo [a, b~\. Si f e C definimos 

(15.2) N(f) = (j b a \f(x)fdx) m . 

Esta es una norma consecuencia del producto interior. 

(/> g) = f a ‘'f(x)g(x) dx. 

Observation. Representemos con S el conjunto de todas las funciones f que son 
integrables en [a, fc], El conjunto S es un espacio lineal, y la funcion N definida 
en (15.2) es una seminorma en S. No es una norma porque puede ser N(f)=0 sin que 
f sea identicamente nula en [a, b], 

ejemplo 4. Norma del maximo. Representemos con C el espacio lineal de 
las funciones continuas en un intervalo [a, £>]. Si / e C, definimos 

N(f) = max |/(x)|, 

a<x<b 


en donde el sfmbolo del segundo miembro representa el maximo absoluto de |/| 
en [a, b]. En el ejercicio 4 de la seccion 15.5 se pide la comprobacion de las cua- 
tro propiedades de la norma. 

15.4 Problemas fundamentales en la aproximacion por polinomios 

Sea C el espacio de las funciones continuas en un intervalo dado [a, £>], y 
sea S un subespacio lineal que contiene todos los polinomios de grado ^ n. Su- 
pongamos tambien que en C se ha definido una norma o una seminorma. Elija- 
mos una funcion / deC. Si existe un polinomio P en S tal que 

\\f-P\\ < \\f-Q\\ 
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para todo polinomio Q de S, decimos que P es el polinomio de aproximacion 
optima para / con grado asignado. La palabra «optima» es relativa a la norma 
dada (o la seminorma). El polinomio de aproximacion optima para una cierta 
norma elegida no lo es necesariamente si se elige otra. 

Una vez elegidas una norma o seminorma, se presentan inmediatamente tres 
problemas. 

1. Existencia. Dada / de C, £ existe el polinomio de aproximacion optima 
para / con grado prefijado? 

2. Unicidad. Si existe ese polinomio, les unico? 

3. Construccidn. ^Como puede determinarse, si existe, el polinomio de apro¬ 
ximacion optima para / con grado prefijado? 

Existen, como es natural, otros muchos problemas que pueden considerarse. 
Por ejemplo, si existe un unico polinomio de aproximacion optima P n de grado 
< n , podemos desear obtener cotas superiores de ||/ — P«|| que se puedan utilizar 
para satisfacer ciertas necesidades practicas. O podemos averiguar si ||/ — P*!l 0 
cuando n °° para una norma dada o para alguna otra norma. Si es asf, decimos 
que los polinomios de aproximacion convergen hacia / en esta norma. En tal caso 
existen aproximaciones tan ajustadas como se quiera con relacion a esa norma si n 
es suficientemente grande. Estos ejemplos muestran algunos de los problemas que 
se estudian en la teorfa general de la aproximacion con polinomios. En este estu- 
dio preliminar dedicamos nuestra atencion especialmente a los tres problemas de 
existencia, unicidad y construccidn antes citados. 

Esos tres problemas se pueden resolver totalmente en el caso de la aproxima- 
cidn mediante polinomios de Taylor. Si / posee derivada de orden n en un punto 
a, es facil probar que el polinomio de aproximacion optima de grado - n rela- 
tivo a la seminorma de Taylor para este n es el polinomio de Taylor 


(15.3) P(x)=^^-^(x - a) k . 

k =0 

En efecto, para este polinomio tenemos 

II/-Ell =il/ W (a)-E <,:, (a)| -0, 

0 


asf que la desigualdad ||/ - P|| ^ ||/ - Q|| se satisface para todo polinomio Q. 
Por lo tanto, P es el polinomio de aproximacion optima relativo a esa seminorma. 
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Para establecer la unicidad, consideramos un polinomio cualquiera Q de grado 
^ n tal que \\f — Q|| = 0. Esta ecuacion implica que 

G(«) =/(«), G'(«) =/'(«), Q {n \a) = / <n) (tf). 

Segun el teorema 7.1 del volumen I sabemos que el polinomio de Taylor (15.3) 
es el unico polinomio que satisface todas esas condiciones. Por consiguiente, 
Q — P. La ecuacion (15.3) resuelve tambien el problema de la construction. 

Los tres problemas pueden tambien resolverse para cualquier norma dedu- 
cida de un producto interior. En este caso, el teorema 1.16 nos dice que existe 
un solo polinomio en S para el cual la norma ||/ — Pj| es tan pequena como se 
quiera. En efecto, este P es la proyeccion de / sobre S y viene dado por la 
formula explicita. 


P(x) = 2 (P,e,>,(*), 

o 

en donde e 0 , e x , ..., e„ son funciones que constituyen una base ortonormal para S. 

Por ejemplo, si C es el espacio de las funciones reales continuas en el inter- 
valo [ — 1,1] y si 


(/’ s) = dx * 

los polinomios de Legendre normalizados <p 0 , ?i, .... <p n forman una base orto¬ 
normal para S, y la proyeccion f„ de / sobre S viene dada por 

fjx) = 2(/, <p k )<p k (x), donde (/, cp k ) = j* f(t)<p k (t) dt. 
Recordemos que los polinomios de Legendre normalizados vienen dados por 

<p k (x) = J 2k ^ 1 p k(x) . donde P k (x) = ~ ^ (X 2 - 1)* . 

Los seis primeros son 

<Po(.x) = Vi, <Pi(x) = V| x, <p 2 (x) = i Vl (3x 2 - 1), <p 3 (x) = |Vl (5x 3 - 3x), 
<Pi(x) = IVf (35x 4 — 30x 2 + 3), ?> d (x) = iV ¥ (63x 5 — 70x 3 + 15x). 

Los problemas correspondientes a la seminorma de interpolacion se trataran 
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en la proxima section 15.6. En secciones posteriores estudiaremos la aproxima- 
cion por polinomios relativa a la norma del maximo. 

15.5 Ejercicios 

1. Demostrar que cada uno de los siguientes conjuntos de funciones es un espacio lineal 

a) Todos los polinomios. 

b) Todos los polinomios de grado < n. 

c) Todas las funciones continuas en un intervalo /. 

d) Todas las funciones derivables en cada punto de /. 

e) Todas las funciones que tienen dcrivada de orden n en cada punto dc I. 

f) Todas las funciones con derivadas de orden n en un punto fijo xt\. 

g) Todas las funciones desarrollables cn serie dc potencias cn un entorno de un punto 
dado x«. 

2. Determinar si cada uno dc los siguientes conjuntos de funciones es o no un espacio lineal. 

a) Todos los polinomios de grado n. 

b) Todas las funciones definidas y acotadas en un intervalo [a,b], 

c) Todas las funciones definidas en un intervalo [a, b]. 

d) Todas las funciones monotonas en un intervalo [a, ft], 

e) Todas las funciones integrables en un intervalo [a,b]. 

f) Todas las funciones regulares a trozos monotonas en un intervalo [a,b]. 

g) Todas las funciones que pueden txpresarse en la forma / — g, siendo / y g mono¬ 
tonas crecientes en un intervalo [a, b], 

3. Sea C el espacio lineal de las funciones reales continuas en un intervalo [a, b], Mediante 

la ecuacion que se da, se define en C Una funcion N. En cada caso, determinar cuales 

de las cuatro propiedades de una norma satisface N, y determinar de este modo si N es 
una norma, una seminorma, o ni una cosa ni otra. 

a) N(f) =f(a) . e) N(J) = | £/(x) dx |. 

b) N(f) = |/(a)|. f) iV(/) = £ \f(x)\ dx. 

c) N(f) = | f(b) -f(a) |. g) N(f) = P !/0)| 2 dx . 

d) N(f) = £/(*) dx . h) N(J) = | \j{x) dx | 2 . 

4. Sea C el espacio lineal de las funciones continuas en un intervalo [a, b]. Si f EC, de- 
finimos 

N(f) = max | f{x) \ . 

a<x<b 

Demostrar que N es una norma para C. 

5. Representemos por B el espacio lineal de todas las funciones reales definidas y acotadas 
en un intervalo [a, b). Si f E B definimos 

N(f) = sup | f(x)\, 

a<x<b 
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donde el si'mbolo del segundo miembro representa el extremo superior del conjunto de 
todos los numeros \f(x)\ para x en [a, b]. Demostrar que N es una norma para B. Esta 
es la norma del supremo. 

6. Refiriendose al ejercicio 3, determinar cuales de las funcior.es dadas N tienen la propie- 
dad de que N(/g) < N(f)N(g) para todo par de funciones / y g de C. 

7. Para un entero fijo n > 1, sea S el conjunto de todas las funciones con derivada n-esima 
en un punto x$. Si feS, sea 

n J 

N (f) = ^\f ik K x o)\. 

*=0 

a) Demostrar que N es una seminorma en S. 

b) Demostrar que N(fg) < N(f)N(g) cualesquiera que sean / y g de S. Demostrar 
tambien que la seminorma de Taylor no goza de esa propiedad. 

8. Sea / una funcion real continua en el intervalo [ — 1,1], 

a) Demostrar que el polinomio cuadratico de aproximacion optima relativo a la norma 
cuadratica en [ — 1,11 viene dado por 

P(x) = i \\f(t)dt + \x tf(t)dt + £(3x 2 - 1) £ (3f 2 - 1 )f(t)dt. 

b) Encontrar una formula analoga para el polinomio de aproximacion 6ptima de 
grado < 4. 

9. Calcular las constantes a, b, c de modo que la integral \e x — (a + bx + cx 2 )| 2 dx 
llegue a ser tan pequena como se quiera. 

10. Sea f(x) = |x| para—1 < x < 1. Determinar el polinomio de grado < 4 de aproximacion 
optima para / en [ — 1,1] relativo a la norma cuadratica. 

11. Sea C el espacio lineal de las funciones reales continuas en [ a,b ] con producto interior 

(/, g) = \ b a j(x)g(x) dx. Sea eo . e„ una base ortonormal para el subespacio S de los 

polinomios de grado < n. Sea P el polinomio de S de aproximacion optima para f en C 
relativo a la norma cuadratica. 

a) Demostrar que el cuadrado de la norma del error viene dado por 


\\f-P\? = ll/ll 2 

k=0 


b) Calcular explicitamenle ese error cuando [a, b] = [ —1,1], n = 2, y j(x) = |x|. 

12. Sea f(x) = \/x para x ^ 0. 

a) Demostrar que el polinomio constante P de aproximacion optima para / en el inter¬ 
valo [l,n] relativo a la norma cuadratica es P(x) = (log n)/(n — 1). Calcular \\P — f[\ 2 
para este P. 

b) Hallar el polinomio lineal P de aproximacion optima para / en el intervalo [l,n] 
relativo a la norma cuadratica. Calcular |[P — /|| 2 para este P cuando n = 2. 

13. Sea f(x) = e x . 

a) Demostrar que el polinomio constante P de aproximacidn dptima para / en el inter¬ 
valo [0, n] relativo a la norma cuadratica es P(x) = (e" — 1 )/n. Calcular ||P — /|| 2 para 
este P. 
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b) Hallar el polinomio lineal P de aproximacion dptima para f en el intervalo [0,1] 
relativo a la norma cuadratica. Calcular ||P — f\\ 2 para este P. 

14. Sean Po, Pi, ...,P„ «+l polinomios ortonormales en la, b] relativos al producto 

interior del ejercicio 11. Supongase tambien que P t es de grado k. 
a) Demostrar que tres polinomios consecutivos cualesquiera de ese conjunto estan liga- 
dos por una relacion de recurrencia de la forma 


P k+ i(jc) = (a k x + b k )P k (x) + c t P w W 


para 1 < k < n — 1, siendo at, 6t, ct constantes. , 

b) Determinar expllcitamente esa relacion de recurrencia cuando los polinomios son os 
polinomios de Legendre ortonormales. 

15. En relacion con el ejercicio 14, y designando por pt los coeficientes de x en Pk(x). 

a) Demostrar que at = pt+i/pt. . 

b) Utilizar la relacion de recurrencia del ejercicio 14 para deducir la lormula 

Pm Pm k l(x)Pm(yl ~ P mi x )P 

2 aw™ - ^ • 

fc =0 


valida para x ^ y. Discutir tambien el caso limite x = y. 


15.6 Polinomios de interpolacion 

Volvemos ahora a la aproximacion mediante polinomios de interpolacion. Se 
conocen los valores de una funcion / en n + 1 puntos distintos x 0 , x lt ..., x„ y 
buscamos un polinomio P de grado 2 n que satisfaga las condiciones 

(15.4) P{x a ) = f{x a ), P{x k ) = /(xi), ... , P(x„) = f(x«) ■ 

Primero demostramos que si existe tal polinomio, este es unico. Luego probamos 
su existencia por medio de su construccion explicita. Este polinomio bace minima 
la distancia de / a P, medida con la semincrma de interpolacion para ese n, 

u-p\\ =ii /(**)-■P(**)i • 

*=0 

Puesto que la distancia es 0 si P satisface (15.4), el polinomio de interpolacion P 
es el de aproximacion optima relativo a aquella seminorma. 

TEOREMA 15.1. teorema de unicidad. Dados n + 1 puntos distintos x 0 , 
*!,..., x„, sean P y Q dos polinomios de grado ^ n tales que 

P(x k ) = Q(x k ) 

para cada k = 0, 1, 2, ..., n. Entonces P(x) = Q(x) para todo x. 
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Demostracion. Sea R(x) = P(x) — 0(x). La funcion R es un polinomio de 
grado ^ n que tiene n + 1 ceros distintos en los puntos x„, x u ..., x„. El unico 
polinomio que goza de esta propiedad es el polinomio nulo. Por lo tanto, P(x) = 0 
para todo x, luego P(x) = Q(x) para todo x. 

El polinomio de interpolacion P puede construirse de varias maneras. Expo- 
nemos primero un metodo de Lagrange. Sea A(x) el polinomio dado por la 
ecuacion 

(15.5) A(x) = (x - x 0 )(x - x x ) ■ ■ ■ (x - x n ) = TT(* - Xj). 

3=0 

Este polinomio tiene un cero simple en cada uno de los puntos x,. Sea A k (x) el 
polinomio de grado n obtenido del A(x) por la supresion del factor x — x k . Esto es, 

(15.6) A k (x) = fj (x - x 3 ). 

j=0 

j*k 

El polinomio A k (x) tiene un cero simple en cada punto x, ^ x k . En el punto x k 
tenemos 

(15.7) ^(**)“tT (**-*,). 

3 =o 
i±k 

Este producto no es cero ya que ningun factor lo es. Por consiguiente, el polinomio 
Ak(x)/A k (x k ) toma el valor 1 cuando x = x k y el valor 0 cuando x = x,- para 
Xj ¥=■ x k . Sea ahora 


w-S 


f(x k )A k (x) 

Mx k ) 


Cuando x = x>, cada termino de esta suma se anula excepto el termino de lugar j, 
que toma el valor /(x,). Por consiguiente, P(x ; ) = /(x,) para cada j. Puesto que 
cada termino de esta suma es un polinomio de grado n, la suma es a su vez un 
polinomio de grado ^ n. Asf pues, hemos encontrado un polinomio que satisface 
las condiciones exigidas. Estos resultados podemos resumirlos en el teorema si- 
guiente: 


teorema 15.2. Dados n + 1 puntos distintos x 0 , x 1; ..., x„ y n + 1 nu- 
meros reales /(x 0 ), f(x x ), ..., f(x„), no necesariamente distintos, existe un polino- 
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mio P y solo uno de grado ^ n tal que Pixj) = fixj) para cada j = 0, 1, 2, ..., n. 
Este polinomio viene dado por la formula 


(15.8) 


= 2 

k =0 


f(x k )A k jx) 

Aic( x k) 


en dotide Ak(x) es el polinomio definido por (15.6). 

La formula (15.8) que da P(x) se llama formula de interpolacidn de Lagrange. 
Podemos ponerla en la forma 


P(x) = ^f(x k )L k (x), 

k =0 

donde Lk(x) es un polinomio de grado n dado por 

A k (x) 


(15.9) 


L k (x) 


A k (x k ) 


De este modo, para cada x fijo, P(x) es una combinacion lineal de los valores pre- 
fijados fix 0 ), fix,), fix„). Los multiplicadores L k (x) dependen tan solo de los 
puntos x„, x„ ..., x„ y no de los valores prefijados antes citados. Se llaman 
coeficientes de interpolacidn de Lagrange. Si utilizamos las formulas (15.6) y 
(15.7) podemos escribir la ecuacion (15.9) en la forma 


(15.10) 


L k ix) = 


JJ X-Xj 

s=o x k — Xj 


Esta formula proporciona un metodo eficiente para calcular el numero Lkix) para 
un x dado. 


Observacidn. Los coeficientes de Lagrange Lt(x) se expresan frecuentemente en 
la forma 


L k ix) = 


A k (x) 
A\x k ) ’ 


donde A' es la derivada del polinomio (15.5). Para demostrar esa formula basta 
probar que A'(,Xt) = A k (x k ). Derivando la relacion 


A(x) = (x - x k )A k (x) 


obtenemos A'(x) - lx - x k )A\(x) + A tlx). Cuando * = x k se obtiene A'{x k ) = Atlx k ). 
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ejemplo. Determinar el polinomio de grado =£ 3 que toma los valores y a , 
yi, y 2 , y 3 en los puntos -2, -1, 1, 2 respectivamente. 

Solution. Tomamos x 0 = -2, x x = -1, x 2 = 1, x 3 - 2. Los polinomios 
Lk(x) dados por (15.10) son ahora 


T / \ O + 1)0 - 1)0 - 2) 1 , , , N/ 

L 0 (x) =---(x + l)(x — l)(x — 2), 

(—2 + 1)(—2 — 1)(—2 — 2 ) 12 ' 

r , . (x + 2)(x — l)(x — 2) 1 . 

(-1 +2)(-l - 1)(—1 -2) 6 ' 

T , , (x + 2)(x + l)(x — 2) 1 . „ . 

L 2 (x) = -- ■■■ > -- =-(x + 2)(x + l)(x - 2), 

(1 + 2)(1 + 1)(1 - 2) 6 

T , . 0 + 2)0 + 1)0 — l) l , ... ... .. 

L 3 (x) = v —— ^ A - !■ = — (X + 2)(x + 1)0 - 1). 

(2 + 2)(2 + 1)(2 - 1 ) 12 V A 


Por lo tanto, el polinomio que se busca es 

P(x) = y 0 L 0 (x) + y^ix) + y 2 L 2 (x) + y 3 L 3 (x) 

= ~ 12 (X + 1)(X ~ 1)(X “ 2 ) + f- O + 2)(x - l)(x - 2) 
- ~(x + 2)(x + l)(x -2) + ^(x + 2)(x + l)(x - 1). 


Para calcular el valor de P(x) para un x determinado es mejor dejar el polinomio 
en esta forma en lugar de ordenarlo en potencias crecientes de x. Por ejemplo, si 
yo = — 5, yx = 1, y 2 = 1, e y 3 = 7, el valor de P(x) para x = % viene dado por 




*(f)(*)(-*) + Kl)(i)(-j) - *(i)(t)(-i) + MMm 

_2^5_7 I ^5 I 24 5 278 ")7 

90 48 48 i 96 — 96 — ^8 • 


15.7 Puntos de interpolacion igualmente separados 

En la discusion anterior se ha supuesto que los puntos de interpolacion 
x„, Xj, ..., x n eran distintos, pero por lo demas cualesquiera. Si ahora suponemos 
que estan igualmente separados, vamos a demostrar que los coeficientes de Lagran¬ 
ge se simplifican considerablemente. Supongamos x 0 < x, < x 2 < ... < x„,y que 
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h es la distancia entre cada dos puntos consecutivos. Podemos entonces escribir 

Xj — x 0 + jh 


para / = 0, 1, 2, .. 

.., n. Ya que Xk — x,- = (k — j)h, la ecuacion (15.10) se trans- 

forma en 


(15.11) 

- TT * ,T X “ ~J h ~ TT f—-(• 

3=o (k — j)h i=o k — ) 


j*k i*k 

donde 

x — x 0 


h 


En el ultimo termino del segundo miembro de (15.11) el producto de los factores 
independientes de t es 


(15.12) 


n 


TT 


3=0 

i±lc 


i 

k-j 



fc! i=k+i j — k 


(-! )"-* _ ( —1)"-V n\ 
k! (n — k)! n! \k/’ 


siendo (jj*) el coeficiente binomial. Puesto que x — x 0 + th, la ecuacion (15.11) 
se escribira ahora 


(15.13) 


L k (x 0 + th) = 


(—l)”~* /n\ 
n! W 


n 

TT(t-j). 

J=0 

i*k 


Para cada n fijo, el segundo miembro de (15.13) es una funcion de k y de t 
que puede tabularse. En el National Bureau of Standards se prepararon tablas de 
coeficientes de Lagrange para puntos de interpolacion igualmente separados. (Vease 
referencia 13 en la bibliografia del final de este capitulo.) Si x y h se eligen de 
manera que el numero t = (x - x„)/h es tal que para el han sido tabulados los 
coeficientes de Lagrange Lk(x 0 + th), el calculo de P(x„ + th) se reduce a una 
multiplicacion de f(Xk) por el valor tabulado Lk(x„ + th), seguida de adicion. 

15.8 Analisis del error de la interpolacion por polinomios 

Sea / una funcion definida en un intervalo [a, 6] que contiene los n + 1 pun¬ 
tos x 0) Xi, .... x n , y sea P el polinomio de interpolacion de grado ^ n que coin¬ 
cide con / en aquellos puntos. Si alteramos los valores de f en puntos distintos de 
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los de interpolation no variara el polinomio P. Esto prueba que la funcion / y el 
polinomio P pueden diferir considerablemente en los puntos distintos a los de 
interpolacion. Si la funcion dada / tiene ciertas cualidades de «regularidad» en el 
intervalo [a, b] podemos esperar que el polinomio de interpolacion P sera una 
buena aproximacion de / en los puntos distintos de los x*. El teorema que sigue 
nos da una util expresion que nos permite estudiar el error en la interpolacion 
por polinomios cuando la funcion dada posee derivada de orden n + 1 en [a, b]. 

teorema 15.3. Sean x„, x u ..., x„, n + 1 puntos distintos en el dominio 
de una funcion f, y P el polinomio de interpolacion de grado n que coincide 
con f en esos puntos. Elijamos un punto x en el dominio de f y sea [a, /}] un in¬ 
tervalo cerrado cualquiera que contenga los puntos x 0 , x„, y x. Si f posee 

derivada de orden n + l en el intervalo [a, /?] existe por lo menos un punto c 
en el intervalo abierto ( a, p) tal que 

( 15 - 14 ) f(x ) - P(x) = - {x) - f in+1 \c ) , 

(n + 1)! v 

donde 

A(x) = (x - x 0 )(x - Xj) • • ■ (x - x n ). 

Observacion. El punto c depende a la vez de x y de n. 

Demostracion. Si x es uno de los puntos de interpolacion x k , entonces 
A(x jt) = 0 y la ecuacion (15.14) se satisface para cualquier c en (a, /?). Supon- 
gamos, pues, que x no es ninguno de los puntos de interpolacion. Mantengamos 
fijo x y definamos una nueva funcion F en [a, j8] mediante la ecuacion 

(15.15) HO = A(x)[f(t) - P(t )] - A{t)[f(x) - F(x)]. 

El segundo miembro de la ecuacion, como funcion de t, posee derivada de orden 
n + 1; luego lo mismo le ocurre al primer miembro. Puesto que P(t) es un poli¬ 
nomio en if de grado ^ n, su derivada (n + l)-esima es identicamente nula. El 
polinomio A(t) es de grado n + 1, siendo el termino de mayor grado t n+1 , y te- 
nemos j4 (B+1) (f) = (n + 1)!. Por lo tanto, si derivamos la ecuacion (15.15) n + 1 
veces respecto a t obtenemos la fdrmula 

(15.16) F^\t) = ^(xy<”+»(f) - {n + 1)! [/(x) - F(x)]. 

De la definicion que se da en la ecuacion (15.15) vemos que F tiene el valor cero 
en los n + 1 puntos de interpolacion x 0) x 1( .... x„, y tambien en el punto x. 
Por consiguiente, F(t) = 0 en n + 2 puntos distintos del intervalo [o,j8]. Esos 
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puntos determinan n + 1 subintervalos consecutivos de [«, p] y la funcion F se 
anula en los dos extremos de esos subintervalos. Segun el teorema de Rolle, la 
derivada F'(t) debe anularse por lo menos en un punto t interior a cada subinter- 
valo. Si elegimos exactamente uno de tales puntos t en cada subintervalo obtene- 
mos n + 1 puntos distintos en el intervalo abierto (<*, /?) en los que F\t) = 0. 
Esos puntos, a su vez, determinan n subintervalos en cuyos extremos tenemos 
F'(t) = 0. Aplicando el teorema de Rolle a F encontramos que la derivada se- 
gunda F"(t) es cero por lo menos en n puntos distintos de («, P). Aplicando reite- 
radamente el teorema de Rolle n + 1 veces de ese modo encontramos finalmente 
que existe por lo menos un punto c en (a, P) en el que F (n+1) (c) = 0. Sustitu- 
yendo este valor de c en la ecuacion (15.16) obtenemos 


(n + 1)! [f(x) - P(x)] = A(x)f {n+ 1 ) (c), 
que coincide con (15.14). Con lo que queda demostrado el teorema. 

Debe observarse que, al igual que en la aproximacion con polinomios de Tay¬ 
lor, el termino que da el error contiene la derivada (n + l)-esima / ( " +1) (c) calcu- 
lada en un punto desconocido c. Si se conocen los valores extremos de / (,rM) en 
[a, /ffJ. se pueden obtener cotas superior e inferior del error. 

Supongamos ahora que los puntos de interpolacidn estan igualmente separa- 
dos y que x 0 < x-i < x 2 < . .. < x„. Si h representa la distancia entre cada dos 
consecutivos podemos escribir 


Xj — x 0 + jh y x = x 0 + th , 

donde t = (x - x„)/h. Ya que x - x,-= (t - j)h, el polinomio A(x) puede escri- 
birse en la forma siguiente 


A(x) = ft (x - x^ = h n+1 TT (t - j) • 

j—0 i= o 


La formula (15.14) se transforma ahora en 
(15.17) /(*) ~ = 


_ / u+1, (c) 


h n+1 J](t-j), 
(n + 1)! 3=o 


con t = (x — x 0 )/h. 

ejemplo. El error en la interpolacidn lineal. Supongamos que una fun- 
cion / con derivada segunda esta tabulada y que deseamos estimar su valor en un 
punto x intermedio entre los dos consecutivos x 0 y x„ + h. Si hacemos uso de la 
interpolacidn lineal aproximamos la grafica de / en el intervalo [x 0 , x„ + h] por 
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una recta, como muestra la figura 15.1. Si P es el polinomio de interpolacion de 
primer grado, el error estimado en (15.17) es ahora 

(15.18) /(*) - P(x) h\t - 1), 

donde t = (x — x 0 )/h. Cuando x esta situado entre x 0 y x„ + h tenemos 0<t< 1 
y el valor maximo de | t(t — 1)| en este intervalo es Por consiguiente (15.18) 
nos da la estimacion 



Figura 15.1 Interpolacion lineal. 


El punto c es un punto desconocido en el intervalo (x 0 , x 0 + h). Si la derivada 
segunda f" esta acotada en ese intervalo, |/"(x)| ^ M, la estimacion del error es 


I fix) - P(*)| ^ ^ . 

8 

En particular, si / es un seno o un coseno; entonces \f"(x)\ "£ 1 para todo x 
y tenemos |/(x) — P(x)| ^ h 2 / 8. Con una tabla de senos o cosenos con intervalos 
de grado en grado (un grado = tt/ 180 radianes) tenemos h=*/ 180, asi que 


hi 

8 


< 


10 


< 


8(180f 259,200 25,000 


0.00004. 
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Ya que este error no excede a % en la cuarta cifra decimal, la interpolacion 
lineal en una tabla de cuatro cifras decimales serfa satisfactoria. El error esti- 
mado puede mejorarse en las partes de la tabla en donde | /"(c)| sea menor que 1. 

15.9 Ejercicios 


1. En cada caso encontrar el polinomio P de menor grado que satisfaga las condiciones 
dadas. 

a) P( —1) = 0, P(0) = 2, P(2) =7. 

b) P(l) = 1, P(2) = 0, P(3) = 0, P(4) = 1. 

c) P(l) = 1, P(2) = 2, P( 3) = 3, P(0) = 1. 

d) P(0) = -2, P( 1) = 0, P(-l) = -2, P( 2) = 16. 

e) P(—2) = 11, P(-l) = -ll, P(0) = —5, P(l) = -1. 

2. Sea f(x) = cos (ttx/4). Hallar el polinomio de menor grado que toma los mismos valores 
que / en los puntos —2, —§, 0, f, 2. 

3. Sean P un polinomio de grado <n y A(x) = (x — xo) (x — xi)... (x — x„), siendo 
xo, xi,..., x„, n + 1 puntos distintos. 

a) Demostrar que cualquiera que sea el polinomio B el polinomio Q dado por 
Q(x) = P(x) 4- A(x)B(x) coincide con P en los puntos xo, xi,..., x„. 

b) Probar tambien el recfproco. Esto es, si Q es un polinomio cualquiera que coin¬ 
cide con P en los puntos xo.xi,.. .x„, Q(x)=P(x)+A(x)B(x) para un cierto polinomio B. 

4. a) Hallar el polinomio Q de menor grado que satisfaga las condiciones 

G(-2) = -5, G(-l) = -1, (2(D = 1, G'(0) = -1. 

[ Indication: Hallar primero el polinomio P que (ome los valores prescritos en 
—2, —1, 1, y utilizar luego el ejercicio 3 para determinar Q.] 
b) Hallar el polinomio Q de menor grado que satisfaga las condiciones de la parte a) 
con Q'(0) = -3 en lugar de Q'(0) = — 1. 

5. Sea /(x) = log 4 x para x > 0. Calcular P(32), siendo P el polinomio de menor grado 
que coincide con f en los puntos: 

a) * = 1,64. c) *=4,16,64. 

b) * = 1, 16,256. d) * = 1,4,16,64,256. 

Calcular en cada caso la diferencia /(32) — P(32). Estos ejemplos prueban que la preci- 
si6n en la interpolacion por polinomios no se mejora necesariamente aumentando el 
numero de puntos de interpolacion. 

6. Los coeficientes de interpolacion de Lagrange L k (x) dados por la ecuacion (15.10) depen- 
den no solamente de x, sino tambien de los puntos de interpolacion xo, xi,... ,x„. Esta 
dependencia podemos indicarla escribiendo L k (x) = L k (x;X), donde X representa el vector 
del espacio JS.+i dado por X -- (xo, *i,..., x„). Para un numero real dado b, represente- 
mos con b el vector de E„ + i cuyos componentes son todos iguales a b. Si a # 0, de¬ 
mostrar que 


L k (ax + b; aX + b) - L k (x; X). 

Esta es la llamada propiedad de invariancia de los coeficientes de interpolacion de La- 
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grange. El ejercicio siguiente nos hace ver la utilidad de esta propiedad para simplificar 
los calculos. 

7. Sea P el polinomio de grado <4 que toma los valores 


/>( 2.4) = 72, P{ 2.5) = 30, P( 2.7) = 18, P(2.8) = 24, P(3.0) =180. 

a) Introducir nuevos punlos de interpolacion u, ligados a los dados x, por la ecuacion 
U/ = lOx, — 24. Los Uj son enteros. Para cada k = 0,1,2,3,4, determinar los coeficientes 
de interpolacidn de Lagrange L t (x) en funcion de u, siendo u = 1 Ox — 24. 

b) Utilizar la propiedad de invariancia del ejercicio 6 para calcular P(2,6). 

8. Una tabla ds la funcion f(x) = log x contiene entradas desde x — l hasta x = 10 a inter¬ 
vals de 0,001. Los valores intermedios a cada par de entradas consecutivas se han calcu- 
lado mediante interpolacion lineal. Supongamos que las entradas en la tabla son exactas. 

a) Demostrar que el error en la interpolacion lineal no excedera a \ en la sexta cifra 
decimal. 

b) iPara que valores de x sera satisfactoria la interpolacion lineal para una tabla de 
siete cifras? 

c) iCual deberia ser la separation de las entradas en el intervalo 1 < x < 2 de modo 
que la interpolacion lineal sea satisfactoria en una tabla de siete cifras? 

En los ejercicios del 9 al 15, *o, x\,... ,x„ son puntos distintos y 


A (x) = ft (* - x,) , A k (x) = f[ (x - Xj ) , L k (x) = . 

i =0 jJo Mx k ) 

j*k 

9. Deducir la formula A'(x) = A k (x) mediante el uso, a) de la derivacion logarft- 

mica, b) de la formula de interpolacion de Lagrange. 

10. Demostrar cada una de las formulas siguientes: 

a) V L k {x) = 1 y ^ J,*) = 0 P ara todo *• 

Jc=0 k—0 ^ ^ 

U 1 

b) ^ ^ = 0. [ Indicacidn: Utilizar la parte a) con valores de x convenientes.] 

i=0 

11. Sea P un polinomio cualquiera de grado < n. Demostrar que el coeficiente de x“ 
es igual a 

V P(.x k ) 

A.A\x k Y 


12. a) Determinar a y b de modo que el polinomio 


P k (x) = {a 4- b(x - x k ))L k (xf 
tenga las siguientes propiedades: 


P k (Xi) = 0 para todo i, P k (x k ) = 1, y P k {xd = 0 para i * k. 
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b) Determinar c y d de modo que el polinomio 

Qk(x) = {c + d{x - x k )}L k (x ) 2 
tenga las siguientes propiedades: 

Qk(x k ) = 1, Qk(Xi) = 0 para i * k , y Q' k (x^ = 0 para todo i. 

c) Sea H(x) = 2L 0 f(x k )Q k (x) + f'(x k )P k (x) donde f es una funcion dada 
derivable en xo, Xu ..., x„. Demostrar que 

H( x i) = f(Xi) y ff'ixj =f\x i ) para todo/. 

Demostrar tambien que existe a lo mas un polinomio H(x) de grado <2n + 1 con esa 
propiedad. 

13. Dados n + 1 puntos distintos x», xj,.. . ,x„, sean P y Q dos polinomios de grado <n 
que satisfagan las n + 1 condiciones 

P(x 0 ) = Q(x 0 ), P , (x 1 ) = Q'(x i), P"(x 2 ) = Q'(x 2 ), p<«>(x„) = e<"»(x„). 


Demostrar que P(x) = Q(x) para todo x. 
b) Sea Bo(x) = 1, y para n > 1 definimos 


B n (x) = 


x(x — «)” _1 


Demostrar que B'„(x) = B„_i(x — 1) para n > 1 y deducir que 
5„(0) = Bi(l) - Bl(2) = • ■ ■ = - 1) = 0 y = 1. 


c) Demostrar que el unico polinomio de grado <n que satisface las condiciones 

Pi 0) = c 0 , P\ 1) = q, P"(2) = c 2 , .... /*">(«) = c n 

viene dado por 

P(x) = 2 c k B k {x). 


d) Si x k — xo + kh para k = 0,1,2,..., n, donde h > 0, generalizar los resultados de 
b) y c). 

14. Suponiendo que xo, Xi, ... ,x„ son enteros que satisfacen x 0 < xj < ... < x„. 
a) Demostrar que |A'(x t )| > k\ (n — k)\ y deducir que 

V 1 _ 2" 

Z|A'(x*)l ^ «!" 
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b) Sea P un polinomio cualquiera de grado n, cuyo termino de mayor grado es igual 
a x”. Sea M el mayor de los numeros |P(xo)|, jP(xi)!, .... |P(x„)|. Demostrar que 
M ;>rc!/2\ [Indication: Utilizar la parte a) del ejercicio 11.] 

15. Demostrar las siguientes fdrmulas. En las partes a) y b), x es un punto cualquiera dis- 
tinto de xo, X\ .x«. 


A '(x) _ ^ 1 

U x ~ x >' 


£W = 4WvJ_ V_L 

' A'(x) A'(x ) xL, x — x, Zj x - Xj 

V 3=0 5 3=0 1 

i*k i*k 


c) 


A’(x k ) = 2 XT 1 
A'(x k ) ^~i x k- x i' 

3—0 

j*k 


Ajx) y 1 
A'(x) xZ (x - x,) 2 ' 

i*k 


16. Sea P„(x) el polinomio de grado <n que coincida con la funcidn /(x) = e“ x en los n + 1 
enteros x = 0,1,...,«. Puesto que ese polinomio depende de a lo designaremos por 
P„(x; a). Demostrar que el lfmite 


P n (x; a) - 1 

lim- 

o-»o ^ 

existe y es un polinomio en x. Determinar explicitamente dicho polinomio. 


15.10 Formula de interpolacion de Newton 

Representemos con P„ el polinomio de interpolaci6n de grado ^ n que coin 
cide con una funcion dada f en n + 1 puntos distintos x 0 , x u ..., x n . La formula 
de interpolacion de Lagrange nos dice que 

P n (x) = J.L k (x)f(x k ), 

fe= 0 

donde Lk(x) es un polinomio de grado n (el coeficiente de interpolacion de La¬ 
grange) dado por el producto 

(15.19) L*(x) = ft * ~ Xi , para k = 0,1, 2,.. ., n. 

>=°. x k ~ x i 
3*k 

Supongamos que anadimos un nuevo punto de interpolacion x„+i a los dados 
Xq, Xi, ..., x n . Para determinar el polinomio correspondiente P n+ 1 con la formula 
de Lagrange es necesario calcular un nuevo coeficiente de interpolacion L .„+1 y 



Fdrmula de interpolacidn de Newton 


717 


recalcular todos los coeficientes anteriores L 0 , Lx, ..., L n , cada uno de los cuales 
es ahora un polinomio de grado n + 1. En la practica esto supone un trabajo 
considerable. Por consiguiente, es conveniente disponer de otra fdrmula para de- 
terminar P n que permita una mas facil transicion de P„ a P„ +1 . Tal fdrmula 
la descubrid Newton; la deduciremos a partir del teorema siguiente. 

teorema 15.4. Dados n + 2 puntos distintos x 0 , x lf .... x„, x„+i. Sea P„ 
el polinomio de grado ^ n que coincide con una funcidn dada f en x 0 , , x n , 

y sea P n+1 el polinomio de grado ^ n + 1 que coincide con f en x 0 , x u ..., 
x n , x n +x. Existe entonces una constante c„+ 1 , determinada con unicidad por f y 
por los puntos de interpolacidn x Q , ..., * n+x tal que 

(15.20) P n+ 1 (*) = P n (x) + c n+1 (x - x 0 ) ■ ■ ■ (x - x n ). 

Demostracidn. Pongamos Q(x) = P n (x) + c(x — x 0 )... (x — x„), donde c 
es una constante no determinada. Entonces Q es un polinomio de grado ^ n + 1 
que coincide con P„ y por tanto con / en cada uno de los n + 1 puntos x 0 ,... ,x n . 
Elijamos luego c de modo que Q coincida tambidn con / en *„ +1 . Esto exige 

/(*n+l) Pn(x n +l) 4" c(X n 4 1 X B ) • • • (x n+x X n ). 

Puesto que el coeficiente c no es nulo, esta ecuacidn tiene una sola solucion que 
llamamos c„ +1 . Tomando c = c„+i vemos que Q = P„+ x . 

El teorema que sigue expresa P n (x) en funcidn de los numeros c u .... c„. 

TEOREMA 15.5. FdRMULA DE INTERPOLACldN DE NEWTON. Si X 0 , . . . , X„ 
son distintos, tenemos 

(15.21) p n ( x ) = f(x 0 ) + 2c k (x -x 0 )---(x- x k ^). 

k= l 

Demostracidn. Definamos P 0 {x) = f(x 0 ) y tomemos n = 0 en (15.20) ob- 
teniendo 

Pi(x) =/(x 0 ) + Cx(x - x 0 ). 

Hagamos ahora n = 1 en (15.20), con lo que conseguimos 

Pi iW = PlW + C 2 (x - x 0 )(x - X x ) = f(x 0 ) + c x (x - x 0 ) + c 2 (x - x 0 )(x - x x ). 


Por induccion, obtenemos (15.21). 

La propiedad de la fdrmula de Newton expresada en la ecuacidn (15.20) 
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nos permite calcular P„ + i con solo sumar un nuevo termino a P„. Esta propiedad 
no la posee la formula de Lagrange. 

La utilidad de la formula de Newton depende, naturalmente, de la facili- 
dad con la que puedan calcularse los coeficientes c u c 2 , ..., c„. El teorema que 
sigue demuestra que c n es una combinacion lineal de los valores f(x„), ..., f(x„). 

teorema 15.6. Los coeficientes de la formula de interpolation de Newton 
vienen dados por 

(15.22) c n =V * donde 4*(**) = TT (x k - x 3 ). 

X—i /Jjfx*) j~0 

k=0 j*k 

Demostracion. Segun la formula de Lagrange tenemos 

p n(x) = J,L k (x)f(x k ), 

k=0 

en donde L k (x) es el polinomio de grado n dado por (15.19). Puesto que el coe- 
ficiente de x n en Lk(x) es \/A k (x k ), el coeficiente de x n en P„(x) es la suma que 
aparece en (15.22). Por otra parte, la formula de Newton demuestra que el coefi¬ 
ciente de x n en P„(x) es igual a c„. Esto completa la demostracion. 

La ecuacion (15.22) nos proporciona un metodo directo para calcular los 
coeficientes de la formula de Newton. Los numeros A k (xk) aparecen tambien 
como factores en el denominador del coeficiente de interpolacion de Lagrange 
Lk(x). La seccion que sigue describe otro metodo para calcular los coeficientes 
cuando los puntos de interpolacion estan igualmente separados. 

15.11 Puntos de interpolacion igualmente separados. El operador de las diferen- 
cias sucesivas 

En el caso de puntos de interpolacion igualmente separados x k = x 0 + kh 
para k = 0, 1, .... n podemos utilizar la ecuacion (15.12) obteniendo 


1 = fr 1 


= ATT- 1 


( —l) H ~*/n 


hn t*l k - j n ' hn 

En este caso la formula que da c„ del teorema 15.6 se transforma en 

fc =0 x 


(15.23) 


c, 
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La suma del segundo miembro puede calcularse de otra manera en funcion de 
un operador lineal A llamado operador de las diferencias sucesivas. 

definicion. Sean h un numero real jijo y f una funcion dada. La funcion 
A/ definida por la ecuacion 


A/M =/(* + h) -f{x) 

se llama la diferencia primera de f. Esta definida para aquellos puntos x para los 
que tanto x como x + h estan en el dominio de f. Las diferencias de ordenes 
superiores A 2 /, A 3 /, ... se definen por induction como siguen: 

A »+y = A (A 4 /) para k = 1,2, 3,... . 

Observation. Tambien se emplean las notaciones A/./(x) y A/(x; h) cuando sc 
quiere indicar la dependencia de h. Es convenienle definir A 0 / = f. 

La n-esima diferencia A n /(x) es una combinacion lineal de los valores fix), 
fix + h), ...,/(* + nh). Por ejemplo, tenemos 

A*/M = {fix + 2h) -fix + h)} - {fix + h) -fix)} 

— fi x + 2 h) - 2 fix + h) + fix). 

En general, tenemos 

n , 

(15.24) A "/(*) =2(-ir-*r)/(x + kh). 

Esto se demuestra facilmente por induccion respecto a n, utilizando la ley del 
triangulo de Pascal para los coeficientes binomiales: 

(*-.) + 0 - ("")' 

Supongamos ahora que f este definida en n + 1 puntos igualmente separa¬ 
dos Xk = x 0 4- kh para k — 0, 1, ..., n. Entonces de (15.23) y (15.24) obte- 
nemos la formula 

Cn = ih A n /(* 0 )- 

h n n\ 


Esto proporciona un metodo rapido para calcular los coeficientes de la formula 
de interpolacion de Newton. El diagrama de la tabla 15.1, llamado tabla de di- 
ferencias, hace ver como las diferencias sucesivas pueden calcularse sistemati- 
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camente a partir de una tabulacion de los valores de / en los puntos igualmente 
separados. En la tabla se ha escrito fk en lugar de f(x k ). 

La formula de interpolation de Newton (15.21) toma ahora la forma 

(15.25) P„(x) = /(x 0 ) + J TT (* - **) • 

f-i k\ h K j=o 

k =1 



Si escribimos 


TT (X - X,.) = tt(x - x 0 -jh) = h* ff tt0 - J), 

j=o i=*o 3=o \ h ! 3=o 

en donde f = (x — x 0 )//z, la ecuacidn (15.25) se convierte en 
(15.26) E n (x) = /(x 0 ) +J A ^ Xo) H (* - J) • 


15.12 Polinomios factorials 


Si fc es un numero natural, el producto t(t — 1)... (t — k + 1) es un poli- 
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nomio en /de grado k Uamado polinomio factorial A;-esimo. Se representa con el 
simbolo t ik) . Asi pues, segun la definition, 

3—0 

Definimos tambien / (0) = 1. Si consideramos el operador A de las diferencias su- 
cesivas con h = 1, es decir, A/(x) = f(x + 1) - f(x), encontramos que 


A/ (n) = n/ < "- 1 > para n ^ 1. 


Es una formula del mismo tipo que la de la derivation ordinaria de potencias 
Dt n = nt ”~ 1 . Con lo cual vemos que el polinomio factorial f (n) esta relacionado 
con las diferencias del mismo modo que las potencias ordinarias /” lo estan con 
las derivadas. 

Con el uso de los polinomios factoriales, la formula de interpolacion de 
Newton (8.65) se convierte en 




Puesta en esta forma, la formula de Newton se parece a la de Taylor para el 
polinomio de grado ^ n que coincide con / y sus n primeras derivadas en x 0 . Si 
escribimos 


/t\ = t(t - 1) ■ ''(t - k + 1) 

W k\ k\ 


la formula de Newton toma la forma 


P„(x 0 + th ) = (fe) 

En los ejercicios que siguen se exponen otras propiedades de los polinomios fac- 
toriales. 

15.13 Ejercicios 

1. Sea A/(x) = /(x + h) - j(x). Si / es un polinomio de grado n, 

f(x) = aX 

r =0 
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con a» # 0, demostrar que a ) A k f(x) es un polinomio de grado n—k si k<n; b) A n f(x)— 
= n\h'a n \ c) A k f(x) = 0 para k > n. 

2. Sea A j(x) = f(x + h) — j{x). Si f(x) = sen (ax + b), demostrar que 


v n f(x) = ^2 sen yj sen ^ 


ax + b + 


nah + nn\ 


3. Sea A f(x) = j(x + h) - f(x). 

a) Si f(x) = a*, siendo a > 0, demostrar que ^f(x) = (a — Iyer'. 

b) Si g(x) = (l +< 3 )V*, siendo a > 0 demostrar que &'‘g(x) = a k g(x). 

c) Demostrar que el polinomio P„ de grado n que toma los valores P„(k) = (1 + a) k 
para k = 0, 1 , 2,. .., n viene dado por 


x ' a k 
P »W = > T-. 


4H!' 

fc=0 


M) 


4. Sea x(”) el n-esimo polinomio factorial en x. Puesto que *(“) es un polinomio en x de 
grado n con el valor 0 cuando x — 0, podemos escribir 


X M = S?S k ' n X k . 

k= 1 

Los numeros S*,„ se llaman numeros de Stirling de primera especie. De la definici6n de 
*(") resulta evidente que S„.„ = 1 para n > 0. 

a Demostrar que = — n(n — l)/2 y que Si.„ = ( — l) n_1 (« — 1)! para n > 1. 
b) Demostrar que St.„+i = S t _i,„ — nS k ,„. Comprobar esta relation en la tabla 15.2, de 
numeros de Stirling de primera especie, y construir las tres filas siguientes de la tabla. 


Tabla 15.2 


n 

S\,n 

Si.n 

S 3 .T 1 

$i.n 

$5,n 

Sg.n 


i 

1 







2 

-1 

1 






3 

2 

-3 

1 





4 

-6 

11 

-6 

1 




5 

24 

-50 

35 

-10 

1 



6 

-120 

274 

-225 

85 

-15 

1 


7 

720 

-1764 

1624 

-735 

175 

-21 

1 


c) Expresar el polinomio xO) 4- 3x( 3 > + 2x0) + 1 como combination lineal de potencias 
de x. 

5. a) Demostrar que 


(l) 

9 


X = X 


X 2 =*<!> + x< 2 >. 


x 3 = x (1) + 3x (2> + x (3) 
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y quc, cn general. 



*=i 


donde fix) = x" y A f(x) = j(x + 1) — f(x). Los numeros T k .„ = A*/(0)//c! se llaman nu¬ 
meros de Stirling de segunda especie. 

b) Demostrar que 


A*je n +i = (x + k) tx k x n + k A*- 1 *” 
y con ello deducir que T k .„ t [ = T k - 1 .„ + kT k ,„. 

c) Comprobar la tabla 15.3 de numeros de Stirling de segunda especie, con la formula 
de recurrencia de la parte b), y construir las tres filas siguientes de la tabla. 


Tabla 15.3 


n 

n 

72,n 

7*3 ,n 

Ti,n 

T-,. n 

Ten 

Ti.n 

i 

1 







2 

1 

1 






3 

1 

3 

1 





4 

1 

7 

6 

1 




5 

1 

15 

25 

10 

1 



6 

1 

31 

90 

65 

15 

1 


7 

1 

63 

301 

350 

140 

21 

1 


d) Expresar el polinomio x 4 + 3x 3 + 2x — 1 como una combinacidn lineal de polino- 
mios factoriales. 

6. a) Si p es un numero natural y a y b son enteros tales que a < b, demostrar que 


IjtP+l) _ a iP+U 


Esta formula es analoga a la de la integracion \ b a x v dx. Debe observarse, sin embargo, que 
el lfmite superior de la suma es b — 1, y no b. 

b) Comprobar que k(k + 3) = 4kO) + fc( 2 ). Usar entonces la parte a) para demostrar que 


6-1 

y k m 


n 

^ Kk + 3) = 4 


(n + 1) <2) + (" + l) l3) n ( n + 1)(« + 5) 


2 


3 


3 
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c) Si f(k) es un polinomio en k de grado r, demostrar que 


n 

2 m 

1 

es un polinomio en n de grado r + 1. 

7. Con el metodo sugerido en el ejercicio 6 expresar cada una de las sumas siguientes 
como un polinomio en n. 


a) £ (4fc 2 + Ik + 6). 

k=i 

b) £ k\k +1). 


c) £/t(/k + l)(* +2). 

fa -1 

d) ±k*. 

k=1 


8. Designemos con A el operador lineal definido por la ecuacion 


Mf) = a 0 A"/ 4- A"- 1 / + • • • + a„_ x A/ + a n f. 


siendo ao,ai,...,a„ constantes. fiste es el llamado operador diferencia de coeficientes 
constantes. Es analogo al operador derivada de coeficientes constantes descrito en la sec- 
cion 6.7. A cada uno de tales A podemos asociar el polinomio caracteristico p A defini¬ 
do por 


PaO") = <V” + "i r n ~ 1 + ■ ■ ■ + a n -i r + a n . 

Reciprocamente, a todo polinomio p podemos asociar un operador A del cual es polino¬ 
mio caracteristico. Si A y B son dos operadores diferencia de coeficientes constantes y 
X es un niimero real fijo, definimos A+ B, AB, y XA mediante las mismas formulas 
empleadas en la seccidn' 6.7 para los operadores derivada. Demostrar entonces que el 
teorema 6.6 es valido para operadores diferencia de coeficientes constantes. 


15.14 Problema de mlnimo relativo a la norma del maximo 

Consideremos un problema que se presenta espontaneamente en la teorfa de 
la aproximacion por polinomios. En el teorema 15.3 se dedujo la formula del 
error 

( 15 - 27 > f{x) - P(x) = — (x) f (n+1 \c), 

en donde 

A(x) = (x - x 0 )(x - x x ) ■ • • (x - x„). 


Aquf P es el unico polinomio de grado ^ n que coincide con / en n + 1 puntos 
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distintos x<>, x u ..., x„ en [a, 6]. La funcion / se supone con derivada de orden 
n + 1 en [a, 6], y c es un punto desconocido situado en [a, &]. Para estimar 
el error en (15.27) son necesarias cotas para la derivada / (n+1) y para el producto 
A(x). Como A es un polinomio, su valor absoluto posee un maximo en algun 
punto del intervalo [a, b]. Este maximo dependera de la eleccion de los puntos 
x 0 , x-i, .... x„, y es natural procurar elegir esos puntos de manera que la nor¬ 
ma A sea la menor posible. 

Podemos designar ese maximo por ||.A||, donde ||v4|| es la norma del maxi¬ 
mo, dada por 


Mil = max M(x)|. 

a <x<b 


El problema consiste en encontrar un polinomio de grado asignado que haga 
minimo |jA||. El primero en resolver este problema fue Chebyshev; su solution 
conduce a una clase interesante de polinomios que tambien se presentan en otras 
cuestiones. Primero daremos una breve noticia sobre esos polinomios y luego 
volveremos al problema de minimo indicado. 

15.15 Polinomios de Chebyshev 

Sea x + iy un numero complejo de valor absoluto 1. En virtud del desarro- 
llo de Newton tenemos 


(x + iyr 


Jr -0 x ' 

para todo entero n ^ 0. Hagamos en esta fdrmula x = cos 9, y = sen 0, y con- 
sideremos la parte real de cada miembro. Puesto que 


(x + iy) n — (cos 6 + /sen 6) n — e ine = cos nO + i sen nO , 


identificando esas dos partes tenemos 


(15.28) 


cos nO = x n — 



x n -y + 



-4 4 

V 


+ •••• 


Ya que y 2 = sen 2 5 = 1— cos 2 9 = 1 — x 2 , el segundo miembro de (15.28) es 
un polinomio en x de grado n. Ese polinomio es el polinomio de Chebyshev de 
primera especie y se designa con T n (x). 
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definicion. El polinomio de Chebyshev T„(x) se define para todo x real 
por medio de la ecuacion 


T n (x) 



x n ~ 2k (x 2 - 


If. 


De la igualdad (15.28) obtenemos el teorema siguiente. 


teorema 15.7. Si — 1 ^ x 1 entonces tenemos 


T„(x)= cos (n arc cos x). 

Demostracion. Si 9 = arc cos x entonces x = cos 9 y T„(x) = cos nO. 

Los polinomios de Chebyshev pueden calcularse rapidamente tomando la 
parte real de (a + iy) n poniendo y 2 = 1 — x 2 , o utilizando la siguiente formula 
de recurrencia. 

teorema 15.8. Los polinomios de Chebyshev satisfacen la siguiente formula 
de recurrencia 


T n+1 (x ) = 2 xT n (x) - r M _!(x) para n>l, 


siendo T 0 (x) = 1 y h(x) = x. 

Demostracion. Supongamos primero que — 1 ^ x 1 y pongamos x = cos 9 
en la identidad trigonometrica 

cos (« + 1)0 + cos ( n — 1)0 = 2 cos 0 cos nO. 

Esto demuestra que T n+1 (x) + T n -Ax) = 2xT„{x) para x en el intervalo — 1 ^ 
- x ^ 1. Pero ya que ambos miembros son polinomios, esta relacion debe ser 
valida para todo x. 

Los cinco polinomios siguientes son 

T 2 (x) = 2x 2 - 1, r 3 (*) = 4x 3 -3x, T 4 (x) = 8x 4 -8x 2 +l, 

T s (x) = 16a 5 - 20a 3 + 5a, T e ( a) = 32a 6 - 48a 4 + 18a 2 - 1 . 

La formula de recurrencia demuestra que todos los coeficientes de T„(x) 
son enteros; ademas, el coeficiente de x n es 2 n ~\ 
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El teorema que sigue demuestra que T„(x ) tiene exactamente n ceros de pri¬ 
mer orden situados todos en el intervalo [ — 1, 1]. 

teorema 15.9. Si n^ 1 el polinomio T„(x) tiene ceros en los n puntos 

(2k + 1)7T , n i 

x k — cos -— -, k = 0, 1 , 2 , . . . , n — 1 . 

In 

Luego T„(x) admite la factorizacion 

TJx) = 2" _1 (x - x 0 )(x - X!) • ■ • (x - x^) = 2” _1 TT (x - cos ( 2/c + 1)7r \ . 

k =o \ 2 n J 

Demostracion. Usamos la formula T„(x) = cos nd. Puesto que cos nd = 0 
solo si nd es un multiplo impar de ir/2, tenemos T„(x) = 0 para x en [ — 1,1] 
unicamente si n arc cos x — (2k + 1)tt/ 2 para un cierto entero k. Por tanto, los 
:eros de T„ en el intervalo [ — 1,1] se encuentran entre los numeros 

(15.29) x k = cos : ' - - , k = 0, ±1, ±2,.... 

n 2 

Los valores k = 0, 1, 2, . .., n — 1 dan n ceros distintos x„, x,, .... x„-i, si¬ 
tuados todos en el intervalo abierto ( — 1, 1). Puesto que un polinomio de gra- 
do n no puede tener mas de n ceros, esos deben ser todos los ceros de T„. Los 
restantes xt de (15.29) son repeticiones de esos n. 


teorema 15.10. En el intervalo [ — 1,1] los valores extremos de T„(x) son 
+ 1 y — 1, alcanzados alternativamente en los n -f 1 puntos 

kjr 

(15.30) h = cos — , para k = 0, 1, 2 ,. .. , n . 

n 

Demostracion. Segun el teorema de Rolle, el maximo y el mfnimo relati¬ 
ves de T n deben presentarse entre dos ceros consecutivos; existen n — 1 puntos 



Figura 15.2 Graficas de polinomios de Chebyshev en el intervalo [ — 1,1]. 
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de tal naturaleza en el intervalo abierto ( —1,1). En la formula del coseno para 
T n vemos que los valores extremos, ± 1, son alcanzados en los n — 1 puntos 
interiores cos ( kir/n ), k = 1,2, ..., n — 1, y tambien en los extremos x = 1 
y x — —1. Por consiguiente, en el intervalo cerrado [ — 1,1] los valores extre¬ 
mos +1 y — 1 son alcanzados alternativamente en los n + 1 puntos t 0 , t u .... t„ 
dados por tk = cos (k-rr/ri) para k = 0, 1, 2, 

La figura 15.2 representa las graficas de T 2 , ..., T s en el intervalo [ — 1, 1]. 

15.16 Propiedad de tninimo de los polinomios de Chebyshev 

Volvamos ahora al problema de encontrar un polinomio de grado prefijado 
para el que la norma del maximo sea lo mas pequena posible. El problema se 
resuelve con el siguiente teorema. 

teorema 15.11. Sea p„(x) = x” + ... un polinomio cualquiera de grado 
n S: 1 con primer coeficiente igual a 1, y pongamos 

\\PJ = max |p n (x)|. 

Tenemos entonces la desigualdad 

(15.31) \\Pn\\>\\fj, 

en donde T n (x) = T„(x)/2 n_1 . Ademas, la igualdad en (15.31) es valida si 
P* = T n . 

Demostracidn. En el intervalo [ — 1,1] el polinomio T n toma sus valores 
extremos, 1/2 B_1 y —1/2"” 1 , alternativamente en los n + 1 puntos distintos tk 
de la ecuacion (15.30). Por consiguiente, || T n || = 1/2* -1 . 

Demostremos a continuacion que la desigualdad 

( 15 ‘ 32 ) llPnll < 

nos lleva a una contradiccion. Supongamos que p„ satisfaga (15.32) y considere- 
mos la diferencia 


r(x) = f n (x) - p n {x). 

En los puntos tk dados por (15.30) tenemos 
(- 1 )" 


Kfc) = ( ^=T - Pnitk) = (-l/^ - (-1 fPnitk) ■ 
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Debido -a (15.32) el factor entre corchetes es positivo. Por consiguiente, r(t k ) tiene 
signos alternados en los n + 1 puntos t 0 , t u .... f„. Puesto que r es continua 
debe anularse por lo menos una vez entre dos cambios de signo consecutivos. 
Por consiguiente, r tiene por lo menos n ceros distintos. Pero como r es un po- 
linomio de grado ^ n — 1, esto significa que r es identicamente nula. Por lo tan- 
to, Pn = Tn, as! que ||P„|| = ||f„|| = l/2 n_1 , en contradiccion con (15.32). Esto 
demuestra que debe ser ||p«|| ^ l/2 n_l = || T n ||. 

Aunque el teorema 15.11 hace referencia al intervalo [ — 1,1] y a un poli- 
nomio con primer coeficiente 1, puede tambien utilizarse para deducir un resul- 
tado analogo para un intervalo cualquiera [a, b] y un polinomio cualquiera. 

teorema 15.12. Sea q„(x) = c n x n + ... un polinomio de grado n ? \, 
y pongamos 


IkJ = max |q n (x)|. 

a <x < b 

Tenemos entonces la desigualdad 
(15.33) \\qJ>\c n \ ib -Ji ■ 

Ademas, la igualdad en (15.33) es valida si 

(b - a) n (2x — a — b\ 


<7„M = c n ■ 


— a) n T 1 2x — a — b \ 
2 2 "- 1 b — a ) 


Demostracion. Consideremos la transformacion 

2 x — a — b 


t = 


b — a 


Esta aplica el intervalo a ^ x ^ b en forma uno a uno sobre el intervalo 
— 1 ^ t ^ 1. Puesto que 

b — a , . b + a 


tenemos 


luego 


x = 


x = -- f + 

2 2 

+ terminos de grado inferior 


- C-rF- 

Pn 
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en donde p,,(t) es un polinomio en t de grado n con primer coeficiente 1. Apli- 
cando el teorema 15.11 a p„ obtenemos el teorema 15.12. 

15.17 Aplicacion a la formula del error en la interpolacion 

Volvamos ahora a la formula (15.27) del error en la interpolacion por po- 
linomios. Si elegimos los puntos de interpolacion x 0 , x u .... x„ de modo que 
coincidan con los n + 1 ceros del polinomio de Chebyshev T n+1 podemos escri- 
bir (15.27) en la forma 


fix) - P(x) = - Tn+l(x) . / (n+1) (c). 

2 *(u + 1)! 

Los puntos * 0J x u • • ■, x n estan todos en el intervalo abierto ( — 1, 1) y vienen 
dados por 

(2k “f~ 1 7r\ 

x k = cos-para k = 0, 1, 2,.. ., n . 

\ n + 1 2) 

Si x esta en el intervalo [ — 1,1] tenemos \T n+ i(x)\ ^ 1 y el error viene estimado 
por la desigualdad 


\f(x) - P(x) | < 


1 


\f u+1 \c)\. 


2 "(n + 1)! 

Si la interpolacion se efectua en el intervalo la, bj con los puntos 

b — a , b + a 

y k = —— x k + —— 


como puntos de interpolacion, el producto 


A(x) = (x - }’ 0 )(x - yi ) ■ ■ ■ (x - y n ) 

satisface la desigualdad |A(x)| ^ {b — a ) n+1 /2 2n+1 para todo x en [a, b]. La esti- 
macion correspondiente para f(x) — P(x) es 

|/(x) - P(x )| < [ b ~ a)W+1 |/ (n+1) (c)|. 

2 2 " +1 (n + 1)! 


15.18 Ejercicios 

En este conjunto de ejercicios T„ representa el polinomio de Chebyshev de grado n. 

L Demostrar que T„(-x ) = (-1 )"T„(x). Esto demuestra que T„ es funcion par si n-es par 
y funcion impar si n es impar. 
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2. a) Demostrar que en el intervalo abierto ( — 1,1) la derivada T'„ viene dada por la 
formula 




n sen nO 
sen 6 ’ 


donde 0 = arc cos x. 


b) Calcular 77(1) y 7Y(-1). 


3. Demostrar que 


^ Tn 

Jo 


(«) du = ; 


1 (W*) - WO) T’n-lW - T n _ i(0) 


n + 1 


n - 1 


n >2. 


4. a) Demostrar que 2T m (x)T n (x) = T m Jx) + T m _ n (x). 
b) Demostrar que T mn (x) = T m [T n (x)\ = T n [T m (x)]. 

5. Si x — cos 9, demostrar que sen 9 sen n9 es un poiinomio en x, y determinar su grado. 

6. El poiinomio de Chebyshev T„ satisface la ecuacion diferencial 


(1 - x 2 )y" - xy + n 2 y = 0 

en todo el eje real. Demostrarlo con cada uno de los metodos siguientes: 

a) Derivando la relacion T„'(x) sen 9 = n sen nB obtenida en el ejercicio 2 a). 

b) Introducir el cambio de variable x = cos 6 en la ecuacion diferencial 


d 2 (cos nB) 

dd 2 


— n 2 cos nB. 


7. Determinar, en funcion de polinomios de Chebyshev, un poiinomio Q(x) de grado <n 
de aproximacion optima para x " 1 en el intervalo [ — 1, 1] relativo a la norma del 
maximo. 

8. Hallar un poiinomio de grado <4 de aproximacion 6ptima para la funcion f(x) = x s en 
el intervalo [0,1], relativo a la norma del maximo. 

9. Un poiinomio P se llama primario o monario si el coeficiente del termino de mayor 
grado es 1. Para un intervalo dado [a, b] designemos con |jP|| el maximo de \P\ en 
[a,b], Demostrar cada una de las siguientes afirmaciones: 

a) Si b — a < 4, para todo e > 0 existe un poiinomio monario P tal que ||Pj| < e. 

b) Si para todo e > 0 existe un poiinomio monario P tal que jjP|] < e, entonces 
b — a < 4. Dicho de otro modo, los polinomios monarios con norma arbitrariamente 
pequena existen si, y solo si, el intervalo [a, b] tiene longitud menor que 4. 

10. Los polinomios de Chebyshev satisfacen las siguientes relaciones de ortogonalidad: 


i T n (x)T m (x) , 

— - -- dx 

-i V 1 - * 2 


0 si n 5* m, 

n si n — m — 0, 


n 

2 


si n = m > 0. 


Demostrarlas por cada uno de los siguientes metodos: 
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a) A partir de la ecuacion diferencial del ejercicio 6 deducir que 

r; M ) + »• - o. 

Escribir la formula correspondiente intercambiando n y m, restar las dos ecuaciones, 
e integrar entre — 1 y 1. 

b) Utilizar las relaciones de ortogonalidad 


S' 


cos md cos nO dO = 


(0 si n^m, n>0, m> 0, 
si n = m — 0, 

si n — m > 0, 


e introducir el cambio de variable x = cos 9. 

11. Demostrar que para — 1 < x < 1 tenemos 


Tn(x) 

Vi -* 2 


2 n »! d n „ 

(_l)n-n _ y2)n-l/2 

V ; (2n )! dx n U 


12. Sean yi, y 2 ,..., y„ n numeros reales, y 

(2k - 1)tt 

x k - cos ——- para k =1,2. n. 

in 


Sea P el polinomio de grado <n — 1 que toma el valor y* en x k para 1 < < n. Si x 

no es uno de esos x k demostrar que 


| n _ 

P(x) =- j ( -d^ 


T n (x) 

X -x k ’ 


13. Sea P un polinomio de grado < n — 1 tal que 

Vr^ipwi <; i 

para — 1 < x < 1. Demostrar que ||P|| < n, siendo (jP|| el maximo de |P| en el intervalo 
[ — 1,1]. [ Indicacidrt: Utilizar el ejercicio 12. Considerar tres casos: xi < x < 1; 
— 1 < x < x„; x„ < x < xi; en los dos prim eros ha cer uso del ejercicio 15 a) de la sec- 
cion 15.9. En el tercer caso observar que ^/j _ x t ;> sen ( n /2n) > l/n ] 

En los ejercicios del 14 al 18, U„(x) = T^ +1 (x)j(n + 1) para n = 0,1,2,... . 

14. a) Demostrar que U„(x) — 2xU n -\(x) — U„-o(x) para n > 2. 
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b) Determinar la forma expli'cita de los polinomios Uo, Ui ,..., U 6 . 

c) Demostrar que |l/„(x)| < n + 1 si-1 < x < 1. 

15. Demostrar que U„ satisface la ecuacidn diferencial 


(1 - x 2 )y” - 3xy' + n(n + 2)y = 0. 


16. Deducir las relaciones de ortogonalidad 

x 2 U m (x)U n (x) dx 




(0 si m & n. 


si m — n. 


17. Probar que 


_ 2"('n + IV d n 

Vl - X 2 U n (x) = (-!)" ■ — — n (1 - xY +lli 


18. Sean yi, y 2 .y™ n numeros reales y 

kn 


x k = cos 


n + 1 


(In + 1)! dx n 


para k = 1,2. n. 


Sea P el polinomio de grado < n - 1 que toma el valor y* en x k para 1 < k < n. Si x 
no es uno de los x k demostrar que 


P(x) = 


1 

n + 1 


2 
*=1 


(-D^Hl -x| )y k 


Unix) 

X -x k ' 


15.19 Integracidn aproximada. Regia de los trapecios 

Muchos problemas tanto de Matematica pura como aplicada nos conducen a 
nuevas funciones cuyas propiedades no han sido estudiadas o cuyos valores no 
han sido tabulados. Con frecuencia es necesario obtener informacion cuantitativa 
sobre tales funciones, bien en forma grafica, bien en forma numerica. Muchas de 
esas funciones se presentan como integrales del tipo 

F(x) = j X fit) dt, 

•'a 


en las que el integrando / viene dado por una fdrmula analftica expli'cita o es co- 
nocida en parte por datos tabulados. El resto del presente capftulo se dedica a 
algunos de los mas elementales metodos para encontrar aproximaciones numericas 
de tales integrales. La idea basica es muy sencilla. Aproximamos el integrando f 
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Figura 15.3 Regia de los trapecios obtenida mediante interpolacion lineal 


mediante otra funcion P cuya integral es de facil calculo, y tomamos entonces la 
integral de P como aproximacion de la integral de /. 

Si / es no negativa la integral f(x)dx representa el area del conjunto de 
ordenadas de / sobre [a, 6]. Esta interpretacion geometrica de la integral sugiere 
inmediatamente ciertos procedimientos de integration aproximada. La figura 15.3 
muestra un ejemplo de una funcion / con valores conocidos en n + 1 puntos igual- 
mente separados a, a + h, a + 2h, . . ., a + nh = b, donde h = (b — a)/n. Sea 
Xk = a + kh. Para cada k — 0, 1, 2, .. ., n — 1 la grafica de / correspondiente 
al intervalo \_Xk, Xk+ j] ha sido aproximada mediante una funcion lineal que coin- 
cida con / en los extremos x* y x* +1 . Con P designemos la correspondiente funcion 
poligonal de interpolacion defmida sobre todo el intervalo [a,b]. Tenemos en¬ 
tonces 


(15.34) 

Integrando en el intervalo [x*, x* +1 ] encontramos que 
P +1 P(x) dx = h . 

JXk 2 


Cuando / es positiva esta es el area de un trapecio determinado por la grafica de 
P sobre [x^ xt +1 ]. La formula es valida, naturalmente, incluso si f no es siem- 
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pre positiva. Sumando las integrales correspondientes a todos los subintervalos 
[xk.Xk+i] obtenemos 


(15.35) 


f P(x) dx = ^ V [f(x k ) + f(x k+1 )] 

Ja 2 t?o 

= h ~(f(a) + 2J/(a + kh) + f(b)} . 


Para utilizar esta suma como una aproximacion de la integral f(x)dx necesita- 
mos una estimacion del error f(x)dx — P(x)dx. Si f posee derivada segunda 
continua en [ a, b ] este error viene dado por el siguiente teorema. 

teorema 15.13. REGLA de los trapecios. Si suponemos que f tiene de¬ 
rivada segunda f" continua en [ a,b ] y si n es un numero natural, pongamos 
h — (b — a)/n, entonces tenemos 


(15.36) 


/' 


f{x) dx = - 


2 n 


( n—1 . 

f(a) + 2^f(a + kh)+f(b)\ 


(b 


12 n 


frv 


para un cierto c en [a, b]. 


Observation. La formula (15.36) es la regia de los trapecios. El termino 
— f'(c)(b — a) :, /12n 2 representa el error al aproximar J* fix) dx por la JjJ P(x) dx. 
En cuanto se conoce el valor maximo de /" en [a, b] podemos aproximar la integral 
de f con el grado de precision que se desee sin mas que tomar n suficientemente 
grande. Observemos que no se requiere el conocimiento de la funcion P para usar esa 
formula. Tan solo necesilamos conocer los valores de / en los puntos a,a + h,, 
a + nh, y tener una estimacion de |/"(c)|. 

Demostracion. Sea P la funcion de interpolacion dada por (15.34), donde 
Xk = a + kh. En cada subintervalo [**, % +1 ] aplicamos la estima del error para 
la interpolacion lineal dada por el teorema 15.3 y eneontramos 

( 15 . 37 ) fix) - P(x) = (x - x k )(x - x M ) f -^ 

para un cierto c k en (x k , x k+ i). Sean M 2 y m 2 el maximo y el mfnimo, respectiva- 
mente, de /" en {a, 6], y sea 

B(x) = (x - x k )(x k+1 - x)/2. 

Entonces B(x) ^ 0 en el intervalo [x k , x k +i], y de (15.37) obtenemos las desigual- 
dades 


m 2 B(x) <, P(x) -fix) <, M 2 Bix) 
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en este intervalo. Integrando, tenemos 

fXk+h f Xjc+h fXk+h 

(15.38) m 2 | B(x) dx ^ J [P(x) - /(x)] dx £ M 2 I B(x) dx. 

*'Xl c J Xjc 

La integral de B viene dada por 

C Xk+h 1 , fh .3 

B(x) dx = - I (x — x^)(x t+1 — x) dx = ^ I t(h — t) dt = —. 

Jxk 2 J** 2 Jo 12 

Por consiguiente, las desigualdades (15.38) nos dan 

12 r xtr *~ h 

m 2 <, Ti [POO - /(*)] dx < M 2 . 

ft Jxjc 

Sumando esas desigualdades para fc = 0, 1,2, - 1 y dividiendo por n, 

obtenemos 

w 2 ^ ^ J [P(x) - /(x)] dx < M 2 . 

Puesto que la funcion f" es continua en [a, 6], alcanza cualquier valor compren- 
dido entre su mmirno m 2 y su maximo M 2 en algun punto de [a, 6], En particu¬ 
lar, tenemos 

f"( c ) = ~j\ p (x)-f(x)]dx 
para algun c en [a, 6]. Dicho de otro modo, 

f/(x) dx = fp(x) dx - ^/"(c). 

Ja J a 12 

Con (15.35) y la relation h = (b — a)/n obtenemos (15.36). 

Para deducir la regia de los trapecios utilizamos un polinomio lineal para 
interpolar entre cada par de valores consecutivos de f. Se pueden obtener formu¬ 
las mas precisas interpolando con polinomios de grado superior. En la proxima 
section consideramos un caso particular importante notable por su simplicidad 
y precision. 

15.20 Regia de Simpson 

La curva de trazo continuo de la figura 15.4 es la grafica de una funcion f 
correspondiente al intervalo [ a , &]. El punto medio del intervalo, (a + b)/2, se 
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represents con m. La curva de puntos es la grafica de un polinomio cuadratico P 
que coincide con / en los tres puntos a, m y b. Si utilizamos la integral P{x)dx 
como una aproximacidn de J£ f(x)dx vamos a parar a una formula de integration 
aproximada conocida con el nombre de regia de Simpson. 

En lugar de determinar P explicitamente, introducimos una transformation 
lineal que lleva el intervalo [a, fe] sobre el intervalo [0,2]. Si escribimos 

t = — -— , o x — a + (m — a)t, 

m — a 

vemos que t toma los valores 0, 1, 2 cuando x toma los a, m, b. Sea ahora 

(p{t) = P[a + (m — a)t]. 

Entonces fit) es un polinomio cuadratico en t que toma los valores P(a), Pirn), 
P{b) en los puntos t = 0, 1, 2, respectivamente. Tambien, tenemos 

f <p(t) dt = f P[a + (m — a)t ] dt = —-— f P(x) dx ; 

Jo Jo m — a Ja 



Figura 15.4 Interpolacidn mediante un polinomio cuadrdtico P. 


luego 


J P(x) dx = (m — a) 





dt. 


(15.39) 
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Utilicemos ahora la formula de interpolation de Newton para construir f. 
Tenemos 

9(0 = 9(0) + tAtp(0) + t(t - 1) A ^ 0) , 

donde A <p(t) = ?(t + 1) — <p(t). Integrando entre 0 y 2 obtenemos 

/ 0 9(0 * = 2 ^( 0 ) + 2 Af<0) + J AV(0). 

Puesto que Aip(0) = ?(1) — ^(0) y A 2 y>(0) = <p( 2) — 2^(1) + ^(0), la integral es 
igual a 

| o 2 (f{t) dt = M9(0) + 4 ^( 1 ) + 90 ( 2 )] = J[P(«) + 4 P(m) + P(b)]. 
Teniendo en cuenta (15.39) y que P coincide con / en a, m, b, obtenemos 

(15.40) f P(x) dx = [/(a) + 4/(m) + f(b)] . 

J a O 

Por consiguiente, podemos escribir 

f/(x) dx = [/(«) + 4/(m) +f(b) J + R, 

Ja O 

siendo R = .fa/(x)<fx - P(x) dx. 

Si / es polinomio cuadratico, P es identico a / y el error R es cero. Tambien 
se observa que R = 0 cuando / es un polinomio cubico. Para demostrarlo utiliza- 
mos la estimation de error para la interpolation de Lagrange dada por el teorema 
15.3, y escribimos 

(15.41) /(x) - P(x) = (x- a)(x - m)(x - b) f -^, 

3! 

donde c e (a, b). Cuando / es un polinomio cubico la derivada tercera es cons- 
tante, = C, y la formula anterior se transforma en 

/(x) - P(x) = 7 (x - a)(x - m)(x - b) = -(t + h)t(t - h), 

6 6 

donde t = x — m y h = (b — a)/2. Por tanto 

r = f u(x) - p( X )] dx =- r ( t 3 ~ h 2 t) dt =0, 

Ja 6 J-h 
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ya que la ultima integral es una funcion impar. Esta propiedad queda interpretada 
en la figura 15.5. La curva punteada es la grafica de un polinomio cubico / que 
coincide en P en a, m, b. En este caso R =/* [/(*) - P{x)]dx = A, - A 2 , don- 
de Ai y A :2 son las areas de las dos regiones sombreadas. Como que R = 0 las dos 
regiones tienen areas iguales. 

Acabamos de ver que la ecuacion (15.40) es valida si P es un polinomio de 
grado — 3 que coincide con / en a, m y b. Eligiendo cuidadosamente este poli¬ 
nomio podemos mejorar considerablemente la estimation del error (15.41). Ya he- 
mos impuesto tres condiciones a P, a saber, P(a) = /(a), P(m) = /(m), P(b) — f(b). 
Imponemos ahora una cuarta condition, P’(m) = f'(m). Esto hace que P y / ten- 
gan la misma pendiente en (m,/(m)), y podemos esperar que esto mejorara la 
aproximacion de f por P en el intervalo [a, &]. 



Figura 15.5 Las dos regiones sombreadas tienen la misma area para cualquier polinomio 

cubico de interpolacidn. 


Para demostrar que un tal P puede elegirse siempre, sea Q el polinomio cua- 
dratico que coincide con / en a, m, b, y sea 

P(x) = Q(x) + A(x - a)(x - m)(x - b), 

donde A es una constante que hay que determinar. Cualquiera que sea A, este po¬ 
linomio cubico P coincide con Q y por tanto con f en a, m, b. Elijamos ahora A 
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de modo que P'(m) = f(m). Derivando la formula anterior y poniendo x = m 
obtenemos 


P'(m) = Q'(m ) -f A(m — a){m — b). 

Por consiguiente, si tomamos A = [/'(m) - Q'(m)]/[(m - a)(m - b)] se satis- 
face tambien la condicion P'(m) = f’(m). 

A continuacion demostramos que para este P elegido tenemos 

(15.42) fix) - P(x) = (x - a)(x - m)\x - b ) J —^ 

4! 

para algun z en (a, b), con tal de que exista la cuarta derivada f (i) en [a, b], Para 
demostrar (15.42) razonamos como en la demostracion del teorema 15.3. Obser- 
vamos primero que (15.42) se satisface para cualquier z si x — a, m o b. Por con¬ 
siguiente, supuesto que x # a, x m, Xn^b, mantengamos x fijo, e introducimos 
una nueva funcion F definida en [a, b J por la ecuacion 

F (0 = Mx)[f(t) - P(t)] - A(t)[f(x) - P(x )], 

donde 

A(t) = (t- a)(t - mf{t - b ). 

Observemos que F(t) = 0 para t = a, m, b, y x. Segun el teorema de Rolle, F’(t) 
se anula en cada uno de los tres intervalos abiertos determinados por esos cuatro 
puntos. Ademas, F\m ) = 0 debido a que A\m) = 0 y f'(m) = F(m). Por consi¬ 
guiente F'(t) = 0 por lo menos en cuatro puntos distintos de (a, b). Por el teorema 
de Rolle F"(t) = 0 por lo menos en tres puntos, F”’(t) — 0 por lo menos en dos 
puntos, y F< 4 >(t) = 0 por lo menos en un punto, sea este / = z. De la definicion 
de F resulta 

F (4) (0 = A(x)[fW(t) - P< 4 >(/)] - A«\t)[f{x) - P(x)] 

= A{x)f«\t) - 4! [f{x) - P(x)\. 

Cuando sustituimos / = z en esta ecuacion obtenemos (15.42). 

Es cosa sencilla ahora demostrar la regia de Simpson en la forma siguiente. 

teorema 15.14. REGLA de simpson. Si f tiene derivada cuarta continua 
en La, b] y si m = (a + b)/2, entonces 

(15.43) f fix) dx = [fia) + 4/(m) + /(b)] - a) ° /' 4 >( c ) 

J a 6 2880 

para un cierto c de [a, b]. 
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Demostracidn. Representemos con M 4 y m 4 , respectivamente, los valores ma- 
ximo y minimo de / (4) en [a, b], y sea B(x) = —lx — a) (x — m) 2 (x — b)/ 4!. 
Ya que B(x) s 0 para cada x en [a, b], la ecuacion (15.42) nos lleva a las des- 
igualdades 


m t B(x) < P(x) -fix) < M t B(x). 
Integrando, encontramos 

(15.44) m 4 £’ B(x) dx < £ [P(x) — fix)] dx < M 4 £ B(x) dx . 
Para calcular la integral J* B(x)dx tomamos h = (b — a)/2 y tenemos 



J_ 

4! 

2_ 

4! 



a)(x — m) 2 (x — b) dx = 


4! 



h>)dt = ^ 
4! 15 


(b - a ) 5 
2880 



+ h)t\t - h) dt 


Por tanto, las desigualdades de (15.44) nos dan 

m 4 < f [P(x) -f(x)] dx< M t . 

ib — a) J a 

Pero ya que / (4) es continua en [a, b], alcanza un valor cualquiera comprendido 
entre su minimo m 4 y su maximo M 4 en algun punto de [a, b ]. Luego 

/-(c) = f [P(x) - fix)] dx 

ib — a) Ja 


para algun c en [a, 6]. Puesto que/* Pix)dx = %(b — a)[/(a) + 4/(m) + /(&)], 
esta ecuacion nos da (15.43). 

La regia de Simpson es de especial interes porque su precision es mayor de 
lo que podria esperarse a partir del conocimiento de la funcion / tan solo en tres 
puntos. Si los valores de / se conocen en un numero impar de puntos igualmente 
separados, a, a + h, ..., a + 2nh, ordinariamente es mas sencillo aplicar la regia 
de Simpson sucesivamente a cada uno de los intervalos [a, a + 2ft], [a + 2 h, 
a + Ah], .... que actuar con un polinomio de grado — 2n sobre el intervalo 
completo [a, a + 2 nh]. Aplicando la regia de Simpson de esta forma, obtenemos 
la siguiente extension del teorema 15.14. 

TEOREMA 15.15. REGLA DE SIMPSON GENERALIZADA. SupOngamOS que f 
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tenga derivada cuarta continua en [a, &]. Sean h = (b—a)/(2n) y f k = f(a+kh) 
para k = 1, 2 , ,2n — 1 . Tenemos entonces 


L f(x)dx = ^r( /(a)+4 S^+ 2 2 /«+/w) 

' i=l *=1 ' 


(b - n) 5 
2880n 4 




para un tier to c en [a, 6]. 


En el ejercicio 9 de la proxima seccion se propone la demostracion de este 
teorema. 


15.21 Ejercicios 

1. a) Aplicar la regia de los trapecios con n = 10 para calcular un valor aproximado de 
la integral 



Obtener cotas superior e inferior del error. [Vease ejercicio 10 b) para comparar la 
precision con la que se obtiene con la regia de Simpson.] 

b) cCual es el menor valor de n que puede garantizar seis cifras exactas en el calculo 
de log 2 por este metodo? 

2. a) Demostrar que existe un numero positivo c en el intervalo [0,1] tal que la formula 

j'jWdx =/(c) +/(-c) 


es exacta para todos los polinomios de grado <3. 

b) Generalizar el resultado de la parte a) para un intervalo cualquiera. Esto es, demos¬ 
trar que existen dos constantes ci y c 2 en [a, b] tal que la formula 



lf(c i) +/(c 2 )] 


es exacta para todos los polinomios de grado <3. Expresar a y c 2 en funcion de a y b. 

3. a) Demostrar que existe una constante positiva c tal que la formula 


fI/2 

LuJ (x)dx = h /(- c ) +/«)) +m 


es exacta para todos los polinomios de grado <3. 

b) Generalizar el resultado de la parte a) a un intervalo cualquiera. Esto es, demostrar 
que existen dos constantes ci y c 2 en [a, 6] tales que la formula 



— m +f 



+/(c 2 ) 
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es exacta para todos los polinomios de grado <3. Expresar c i y c-> en funcion de a y b’. 

4. Demostrar que existen dos constantes positivas a y b tales que la formula 


f„ e X f(x) dx = \ [af{b) 4- bf(a)] 


es exacta para todos los polinomios de grado <3. 

5. Demostrar que existe una constante positiva c tal que la formula 



e-* 2 f(x) dx = dl [/(-c) + 4/(0) +/(c)] 


es exacta para todos los polinomios de grado <5. 

6. Sea P„ el polinomio de interpolacion de grado < n que coincide con / en ti + 1 puntos 
distintos xo, xi,..., x„. 

a) Demostrar que existen las constantes Au(n), A\(n),... ,A n (.n), que dependen tan 
solo de los numeros xo.xj,... ,x„, a, y b, y no de f, tales que 


f 6 P n (x) dx = ^ A k (n)f(x k ). 

• ° k=0 

Los numeros A t (n) se llaman pesos. (Algunas veces numeros de Christoffel.) 

b) Para un conjunto dado de puntos de interpolacion distintos y un intervalo dado 

[a, b], sean W 0 (n),Wi(n) .W„(n), n + 1 constantes tales que la formula 

|7W dx = 2 W k (n)f(x k ) 

Ja k= o 

es exacta para todos los polinomios de grado <n. Demostrar que 


^ x l W kZ) 

fc =0 


b r +l - a r+l 
r 4 1 


para r = 0, 1,. . . , n. 


fiste es un sistema de n 4 1 ecuaciones lineales que puede usarse para determinar los 
pesos. Puede demostrarse que este sistema tiene siempre solucion unica. Tambien puede 
demostrarse que para una eleccion adecuada de puntos de interpolacion es posible hacer 
todos los pesos iguales. Cuando los pesos son todos iguales la formula de integracion 
se llama formula de integracion de Chebyshev. Los ejercicios 2 y 3 son ejemplos de esa 
formula. El ejercicio siguiente demuestra que para una eleccion adecuada de puntos de 
interpolacidn la formula de integracion que resulta es exacta para todos los polinomios 
de grado <2 n + 1. 

7. En este ejercicio se pueden usar las propiedades de los polinomios de Legendre esta- 
blecidas en las secciones 6.19 y 6.20. Sean xo, xi, ...,x„ los ceros del polinomio de Le¬ 
gendre P„+i(x). Esos ceros son distintos y estan en el intervalo [ — 1,1]. Sea /(x) un polino¬ 
mio en x cualquiera de grado <2 n 4- 1. Dividamos /(x) por P„ t i(x) y escribamos 


/(x) = P n+1 (x)G(x) 4- R(x), 


siendo los polinomios Q y R de grado < n. 
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a) Demostrar que el polinomio R coincide con / en los ceros de P n+ i y que 


j 1 ^f(x)dx = J 1 R(x) dx. 

b) Demostrar que existen n + 1 pesos Wo(n), ..., W„(n) (independientes de /) tales que 

( \f(x)dx =flV k (n)f(x k ). 

Esto da una formula de integracion con n + 1 puntos de interpolation que es exacta para 
todos los polinomios de grado <2 n + 1. 

c) Hacer n = 2 y demostrar que la formula de la parte b) se convierte en 

J \/{x)dx = t/(-V!) + l/(o) + t/(V!)- 

Esta formula es exacta para todos los polinomios de grado <5. 

d) Introducir una transformacion lineal conveniente y escribir nuevamente la formula 
de la parte c) para un intervalo cualquiera [a,b]. 

8. En este ejercicio se expone un metodo debido a Peano para deducir la formula que da 
el error en la regia de Simpson. 

a) Con la integracion por partes reiterada deducir la relacidn 

j u(t)u"'(t)dt = u{t)v"(t) — u'(t)v'(t) + | g(t) dt , 

donde g (t) — u'"(t)v(t). 

b) Suponer que <p posee derivada cuarta continua en el intervalo [ — 1,1]. Tomar 

v(t) = f(l - tf/6, «(/) = <p{t) + <p(-t), 

y usando la parte a) demostrar que 

J_j = £'[?>(-1) + 4?>(0) + y(l>] - j*g(t)dt. 

Demostrar luego que JJ g (t) dt = v>( 4 )(c)/90 para un cierto c en [ — 1,1]. 

c) Con una transformacion lineal conveniente deducir el teorema 15.14 a partir del 
resultado de la parte b). 

9. a) Sean a\,a‘> . a„ n numeros no negativos cuya suma es 1. Supongamos que <p 

es continua en un intervalo [a,b]. Si ct, c%,..., c„ son n puntos cualesquiera en [a, 6] 
(no necesariamente distintos), demostrar que existe por lo menos un punto c en [a, b] 
tal que 


2 a k<P{Ck) = <p(c). 

k =l 

[Indication: Designar con M y m el maximo y el mfnimo respectivamente de <p 
en [a, b ] y emplear la desigualdad m < <p(c k ) < M .] 
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b) Usar la parte a) y el teorema 15.14 para deducir la regia de Simpson generalizada 
que se dio en el teorema 15.15. 

10. Calcular log 2 a partir de la formula log 2 x" 1 dx utilizando la regia de Simpson 

generalizada con a) n = 2; b) n = 5. Dar en cada caso cotas superior e inferior del error. 

11. a) Sea <p(f) un polinomio en t de grado <3. Expresar <p(t) mediante la fdrmula de 
interpolacion de Newton e integrar para deducir la fdrmula 


J o 3 <p(t)dt = f[9>(0) + 39 p(1) + 39>(2) + 9>(3)]. 

b) Sea P el polinomio de interpolacion de grado <3 que coincide con / en los puntos 
a, a + h, a + 2h, a + 3h, siendo h > 0. Con la parte a) demostrar que 

r a+3h 3 h 

P(x) dx = — [f (a) + 3/(a + h) + 3/(a + 2 h) + f (a + 3 h)]. 

c) Suponer que / posee derivada continua en [a, 6], y sea h = (b — a)/ 3. Demostrar 
que 

£ fix) dx = b -Y° [fla) + 3 f(a + h) + 3 f{a + 2 h) + fib)} - ^ f w lc) 

para algun c de t a,b). Esta fdrmula de integracion aproximada se llama regia de Cotes. 

d) Con la regia de Cotes calcular log 2 = x -1 dx y dar cotas superior e inferior 

del error. 

12. a) Utilizar la ecuacidn vectorial r (t) = a sent i+ b cos tj siendo 0 < b < a, y demos¬ 
trar que la longitud L de una elipse viene dada por la integral 

L=4a^J -y/1 — k 2 sen 2 t dt , 

donde k = y/a 2 — b 2 /a. 

b) Probar que la regia de Simpson da la formula 

L =- 3 [a +b + la 2 + b 2 )] - ^ /'< 4 >(c ) 
para un cierto c en [0 ,tt/ 2J, siendo /(f) = yj 1 — k 2 sen 2 t. 


15.22 Formula de sumacion de Euler 


Sea n un entero positivo. Cuando la formula de los trapecios (teorema 15.13) 
se aplica al intervalo [0, n] toma la forma 



n —1 


dx=2/W + !(/(«)- /(0)) 


f\c)n 


12 
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para un cierto c en [0,«]. Si / es un polinomio cuadratico entonces /" es cons- 
tante y por tanto /"(c) = /"(0). En este caso la formula puede volverse a escribir 
en la forma 


(15.45) J/(/c) = |V(x) dx + /(Q) + /(W) + 


Esta formula es exacta cuando / es un polinomio cualquiera de grado ^ 2. 

Euler descubrio una notable generalization de esa formula que es valida 
para cualquier funcion con derivada primera continua. Puede utilizarse para apro- 
ximar integrates mediante sumas o, lo que es mas frecuente, para calcular o apro- 
ximar sumas por medio de integrates. Por este motivo corrientemente se la llama 
formula de «sumacion» y no de integracion. Puede establecerse del siguiente 
modo. 

teorema 15.16. formula de sumaci6n de euler. Si f tiene derivada 
continua en [0 ,n], entonces 


(15.46) j>>)= [7(x) dx + f(0) + /(n) + f(x- 
Jo 2 -'° 

en donde [x] es el mayor entero ^ x. 

Demostracion. La integracion por partes nos da 


M-i )/'(*) dx, 


(15.47) J Q (x - l)f'(x) dx = (n — §)f(n) + 1/(0) - J o 7(x) dx. 


Consideremos ahora la integral [x]f(x)dx y la escribimos como una suma de 
integrates en cada una de las cuales [x] tiene un valor fijo. Asf pues, tenemos 


f 71 "JL 1 fr+1 n_1 fr+1 

J 0 [x]f'(x) dx = 2 J r [x]/'(x) dx = 2 r J fix) dx 

r —0 r —0 r 

= lHf(r + 1) -f(r)) =”f rf(r + 1) -”fr/(r) 

r“0 r-0 r=0 

= - 2/(r + 1) +l(r + 1 )/(r + 1) -”£r/(r) 

r=0 r=0 r= 0 

= - 2/(fc) + «/(«) = - |/(fc) +/(0) + nf(n). 
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Restando esta de la ecuacion (15.47) obtenemos 


(x - [x] - |)/'(x) dx = 2 - 


m + fin) 


Pn 

Jo 


f(x) dx, 


que es equivalente a (15.46). 


La ultima integral del segundo miembro de (15.46) puede ponerse en la forma 

/„ (x - [x] - i)f'(x) dx = f o ^(x)/'(x) dx, 

en donde 9^ es la funcion definida por 

lx — [x] — £ si x no es entero 


9>i(x) = 


si x es entero 


La grafica de % es la de la figura 15.6 a). Observemos que %{x + 1 ) = <Pi(x), lo 
cual significa que <Pi es periodica con periodo 1. Asimismo, si 0 < x < 1 tenemos 
%(x) = x - %, asf que /J fMdt = 0 . 

La figura 15.6 b) es la grafica de ( P 2> integral indefinida de ( Pi, dada por 


95 2 (x) = J g <p t ( t) dt. 

Es facil comprobar que <p 2 tambien es periodica con periodo 1. Ademas, tenemos 
<p 2 (x) = —— si 0 < x < 1 . 

9>.(x) <P 2 (x) = j'<p,(t)dt 



Figura 15.6 Graficas de las junciones periodicas q>i y < p 2 . 
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Esto prueba que — % ^ f f 2 (x) ^ 0 para todo x. Las desigualdades — % < <P z (x) < 0 
son validas salvo cuando x es un entero o la mitad de un entero. 

El teorema siguiente da otra version de la formula de sumacion de Euler en 
funcion de <p 2 . 

teorema 15.17. Si f " es continua en [0, n] tenemos 

( 15 . 48 ) j>>) = f fix) dx + ^ (0) + f — - n(x)f"(x) dx . 

fc =0 J 

Demostracion. Puesto que <p’ 2 {x) — ( fl (x) en los puntos de continuidad de 
<Pu tenemos 

J 0 ” <pi(x)f'(x) dx = J o <p' 2 (x)f'{x) dx. 

La integracion por partes nos da 

J” tp'Mf'ix) dx = <p 2 (x)f'(x) |“- /” <p 2 (x)f”(x) dx = -J o (p 2 (x)f"(x) dx, 

puesto que cp 2 (n) =<p 2 (0) = 0. Aplicando esta fdrmula en (15.46) obtenemos 

(15.48) . 


Observation. Si bien los teoremas 15.16 y 15.17 se refieren al intervalo [0, n], 
ambas formulas son validas cuando 0 se sustituye por 1 o por cualquier entero po- 
sitivo <n. 

Como ejemplo de aplicacion de la formula de sumacion de Euler deducire- 
mos la siguiente formula para log n\. 

teorema 15.18. Para cualquier entero positivo n tenemos 
( 15 . 49 ) log «! = (n + i) log n — n + C + E{n), 

donde 0 < E(n) < 1/(8 n) y C = 1 + ST t~*q>z(f)dt. 

Demostracion. Pongamos /(x) = log x y apliquemos el teorema 15.17 al 
intervalo [1,«]. Elio nos da 


2 Io S k 

k =1 



x dx + \ log n + 



dx. 
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Utilizando la relation / log t dt = f log t — t podemos poner esa ecuacion en 
la forma 

15.50 log n! = (n + §) log n — n + 1 + j dt. 

Puesto que ]( p 2 (t)\ - % la integral impropiajf t~\ 2 (t)dt converge absolutamente 
y podemos escribir 


r^dt- r 

J 1 r J 1 t 2 Jn 


<Pi(t) 


dt. 


Por consiguiente, la ecuacion (15.50) se transforma en 

log n ! = (n + J) log n — n + C — f dt, 

Jn t 

donde C = 1 + J” t~ 2 <p 2 (t)dt. Puesto que — % < (p 2 (t) < 0 salvo si t es un entero 
o la mitad de un entero, obtenemos 


0 < -faja*<J. 

J n t 8n 


Esto demuestra (15.49), poniendo E(n) = — J” t~ 2( p 2 {t)dt. 

Del teorema 15.18 podemos deducir la fdrmula de Stirling que permite una 
estimation de «!. 

teorema 15.19. fOrmula de Stirling. Si n es un entero positivo tenemos 
72 ^ n n+1/2 e~ n < n! < ^ n n+1/2 e~ n (l + -pj . 

Demostracidn. Utilizando la ecuacion (15.49) y las desigualdades para E(n) 
obtenemos 

exp ((n + J) log n — n + C) < n ! < exp ^(n + J) log n — n + C + , 

en donde exp ( t ) = e*. Teniendo en cuenta que e? < 1 + 2x, con x — l/(8n), po¬ 
demos poner esas desigualdades en la forma 

An n+V2 e - n < „! < An n+V2 e~ n {\ + -pj , 


(15.51) 
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donde A = e°. Para terminar la demostracion es preciso probar que A — sIl-n. 
Deduciremos esto a partir de la desigualdad 


(15.52) 


7rn < 


/ 2 2 >!)Y n(2n + 1) 

l (2 b)! ) S 2 


descubierta por John Wallis (1616-1703). Primero demostraremos que la desigual¬ 
dad de Wallis implica A = jlir, luego exponemos la demostracion de (15.52). 
Si ponemos 


" n n+1/2 e~ n 

la desigualdad (15.51) implica 


A<A - <A { i+ £)- 

Esto prueba que A„ -» A cuando n -» <». En (15.52) escribimos nl = n n+V4 e~M» 
para conseguir 


que equivale a 


„„ < / 2 \ 2 7r(2n + 1) 

- \ {2n fn + m e -Zn A J - 2 


7T < 


a 4 

2/4 2 


^ 7T 


2b + 1 
2b 


Haciendo que «->» en esta ultima desigualdad obtenemos 



< TT . 


Lo que demuestra que A 2 = 2ir. Puesto que A > 0 tenemos A — V2tt, como se 
afirmo. 

Queda por demostrar la desigualdad de Wallis (15.52). A tal fin introduci- 
mos los numeros 


fjr/2 

= Jo sen" t dt, 

siendo n un entero no negativo cualquiera. Observemos que I 0 — tt/ 2 e h = 1. 
Para 0 =£ t ^ 7r/2 tenemos 0 ^ sen t ^ 1; luego 0 ^ sen" +1 f ^ sen” t. Esto de¬ 
muestra que la sucesion {/„} es monotona decreciente. Por tan to podemos escribir 


IzrJin-l 


T 2 


hn^2n+l 


(15.53) 
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Calcularemos ahora cada uno de los miembros de esta desigualdad; esto nos con- 
ducira inmediatamente a la desigualdad de Wallis. 

La integracion de la identidad 

— (cos t sen n+1 *)={« + 1) sen” t — (n + 2) sen n+2 1 
dt 

en el intervalo [0, t/ 2] nos da 


0 = (n + l)/ n — (n 4- 2)/ n+2 , 


o 

(15.54) / n+2 = ^L±i/ 

n + 2 


Utilizando esta fdrmula recurrente reemplazando n por 2k — 2 encontramos 


I 2k _ 2k - 1 _ 2k{2k - 1) 

/»*—2 2k {2k? 

Multiplicando esas ecuaciones para k = 1, 2, ..., n se halla 


TT _fr 2k(2k- 1) _ (2h)! 

*=i (2/c) 2 2 a "(w !) 2 ' 


Simplificado el producto del primer miembro resulta I 2 „/I 0 . Puesto que /„ = tt/2 
obtenemos 


(15.55) 


(2n)! n 
2 a "(n !) 2 2‘ 


Analogamente aplicamos la fdrmula de recurrencia (15.54) reemplazando n por 
2k — 1 y multiplicando las ecuaciones que resultan para k = 1, 2, .... n con lo 
que se obtiene 


fy W = jj (2k? = 2 2 ”(n!) 2 _ 1 n _1_ 

*=i J=i 2k(2k +1) (2n + 1)! _ 2w + 1 2 '1 2n ' 

El producto del primer miembro una vez simplificado se reduce a / 2 „ +i//i = 
= /an+i, con lo que llegamos a 

_ 77 
“ 2(2n + 1) ‘ 


(15.56) 
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Puesto que I 2n+1 = 2n / 27t _ 1 /(2n + 1), la ecuacion (15.56) implica 

II = — 

-*2n*2n—1 A 

4 n 

Utilizamos este resultado en (15.53), as( como las relaciones (15.55) y (15.56). 
Multiplicando luego por - 5 /4 obtenemos la desigualdad de Wallis (15.52). 

15.23 Ejercicios 


1. Si / es un polinomio de grado < 2, demostrar que la formula de sumacion de Euler 
(15.48) se reduce a la formula de los trapecios, expresada en la ecuacion (15.45). 

2. La constante de Euler se define mediante la formula 


(Vease la secci6n 10.17 del volumen I.) Demostrar con la fdrmula de sumacidn de Euler 
que 


2i=log«+C+l 


E{ti) 


donde 0 < E(n) < J. Asimismo, demostrar que 

i f 2 *' 

3) a) Si s > 0, s 5 * 1, demostrar con la formula de sumacion de Euler que 

V 1 ^ , f 00 t - [t] 

Zi? = — s +c( - s)+s ! 

Jc=1 

siendo 

i r «> t - [t] 

-i ^ 


dt. 


C(s) = 1 + • 


dt. 


b) Si s > 1, demostrar que C(s) = J(s), siendo f la funcion zeta de Riemann definida 
para s > 1 mediante la serie 
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Esta serie diverge para s < 1. No obstante, puesto que la formula que da C(s) en la 
parte a) tiene sentido para 0 < s < 1, puede utilizarse para extender la definition de f(s) 
al intervalo abierto 0 < s < 1. Asi pues, para s>0 js^l tenemos la formula 

1 I* 00 t - [r] , 

£Cs) - l +—j- ^ —p+r dt - 

Esto es un teorema si s > 1, y una definition si 0 < s < 1. 

En los ejercicios del 4 al 6, <p 2 es la funci6n introducida en 15.22. 

4. a) Emplear la formula de sumacion de Euler para demostrar que 

V' , f" logr-1 

y log 2 k = (n + |) log 2 n — 2n log n + 2n — 2 +2 <p 2 (,x) -^— dx. 

k= 1 *' 1 

b) Utilizar la parte a) para deducir que para n > e tenemos 
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b) Utilizar la parte a) para deducir que para n > 2 tenemos 


2 Fkh = lo 8 (1 °g" } + A + 


siendo A una constante y 0 < E{n) < 77 :-. 

4W 2 log n 

7. a) Si a > 0 y p > 0, demostrar con la fdrmula de sumacion de Euler que 


00 r|l d — J 


<P 1 (x)x v - 1 e~ axr dx, 


siendo r la funcion gamma, 
b) Mediante la parte a) demostrar que 


■(' *J) 


4- 8 , donde 0 < 8 < 1. 


8 . Deducir los llmites siguientes con la ayuda de la formula de Stirling o de la de Wallis 
o de ambas. 


(«!) 2 2 a ” 

b) Hm . = V 71 -- 

»-.« ( 2 «) ! sjn 

c) lim (-l) n ( = -J= . 

J!— CO \ / 7T 

/* ?r/2 

9. Sea /. = sen” f dt, siendo n un entero no negativo. En la seccidn 15.22 se demostrd 

Jo 

que la sucesidn {/„} satisface la formula de recurrencia 


In+i ~V+l In - 


Pongamos /(«) = \ yj it T ^ 1 j j V ^ 2 + lj,siendo r la funcidn gam 
a) Utilizar la ecuacidn funcional r(s + 1) = sr(s) para demostrar que 

/( „ + 2) = 1±1 /(„). 


gamma. 
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b) Con la parte a) deducir que 


flT/2 

Jo “ 


sen" t dt 
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SOLUCIONES A LOS EJERCICIOS 


Capitulo 1 

1.5 Ejercicios (pag. 8) 


1 . 

Si 



8 . 

Si 


15. 

Si 


22 . 

Si 


2 . 

Si 



9. 

Si 


16. 

Si 


23. 

No 


3. 

Si 



10 . 

Si 


17. 

Si 


24. 

Si 


4. 

Si 



11 . 

No 


18. 

Si 


25. 

No 


5. 

No 



12 . 

Si 


19. 

Si 


26. 

Si 


6 . 

Si 



13. 

Si 


20 . 

Si 


27. 

Si 


7. 

Si 



14. 

No 


21 . 

Si 


28. 

Si 


31. 

a) 

No 

b) 

No 

c) 

No 

d) No 






1.10 Ejercicios (pag. 

16) 









1 . 

Si 

2 


5. 

Si ; 

1 

9. 

Si ; 

1 

13. 

Si ■; 

n 

2 . 

Si 

2 


6 . 

No 


10 . 

Si ; 

1 

14. 

Si ; 

n 

3. 

Si 

2 


7. 

No 


11 . 

si ; 

n 

15. 

Si ; 

n 

4. 

Si : 

2 


8 . 

No 


12 . 

Si ; 

n 

16. 

Si ; 

n 

17. 

Si 

dim = 

1 

+ \n 

si n es 

par, \ 

,(n + 1 ) si 

n es impar 




18. 

Si 

dim = 

In si n 

es par, 

\{n 4 

- 1 ) si n es 

impar 





19. 

Si 

k + 1 











20 . 

No 












21 . 

a) 

dim = 3 


b) 

dim = 

3 

c) dim = 

: 2 

d) 

dim = 2 



23. 

a) 

si a ^ 0 

y 

b * 

0 , el conjunto 

es independiente, < 

dim 

= 3; si a 6 b 

es cero, 

el con- 


junto es dependiente; dim = 2 (b) independiente , dim =2 c) si a ^ 0 , indepen- 
diente , dim =3; si a = 0,dependiente, dim =2 d) independiente; dim = 3 
e) dependiente; dim =2 f) independiente dint =2 g) independiente dim = 
h) dependiente; dim =2 i) independiente; dim =2 j) independiente; dim = 


1.13 Ejercicios (pag. 24) 

1. a) No b) No c) No 


8 . 

10 . 


a) iVe 2 + 1 b) g(x) = b^x 

(n + 1X2/1 + 1) n + 1 

b) - .^— a+ b 


d) No e) Si ' 


e 2 + 1 

4 


)• 


b arbitrario 


c) 


K'> 


= "(' 


In + 1 \ 


11. c) 43 d) g(l) = a( 1 — §/),« arbitrario 

12. a) No b) No c) No d) No 

13. c) 1 d) e 2 — 1 

14. c) nil 2 » +1 


a arbitrario 


1.17 Ejercicios (pag. 36) 

1 . a) y b) U D, «V6(I, -2, 1) 


757 


lO to 
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Soluciones a los ejercicios 


2. a) lV2 (1, 1,0,0), *V6(-1, 1,2,0), iv 7 3 (1, -1, 1, 3) 
b) iV3(l, 1,0,1), 0.-2, 6,1) 

6. f - i log 2 3 

7. e 2 — 1 

3 

8. i(e — e + - x; 1 — le 2 

e 

9. 7r — 2 sen x 
10. 1 - i* 

Capitulo 2 


2.4 Ejercicios (pag. 44) 


1. 

Lineal ; 

dimension del nucleo 

0 , 

rango 2 

2. 

Lineal; 

dimension del nucleo 

0 , 

rango 2 

3. 

Lineal; 

dimension del nucleo 

L 

rango 1 

4. 

Lineal; 

dimension del nucleo 

1, 

rango 1 

5. 

No lineal 




6. 

No lineal 




7. 

No lineal 




8. 

No lineal 




9. 

Lineal; 

dimension del nucleo 0, 

rango 2 

10. 

Lineal; 

dimension del nucleo 

0 , 

rango 2 

11. 

Lineal; 

dimension del nucleo 

0 , 

rango 2 

12. 

Lineal; 

dimension del nucleo 

0, 

rango 2 

13. 

No lineal 




14. 

Lineal; 

dimension del nucleo 0, 

rango 2 

15. 

No lineal 



16. 

Lineal; 

dimension del nucleo 

0 , 

rango 3 

17. 

Lineal; 

dimension del nucleo 

1, 

rango 2 

18. 

Lineal; 

dimension del nucleo 

0 , 

rango 3 

19. 

No lineal 



20. 

No lineal 




21. 

No lineal 




22. 

No lineal 




23. 

Lineal; 

dimension del nucleo 

1, 

rango 2 

24. 

Lineal; 

dimension del nucleo 

0, 

rango n + 1 

25. 

Lineal; 

dimension del nucleo 

1. 

rango infinito 

26. 

Lineal ; 

dimension del nucleo infinita , rango 2 

27. 

Lineal; 

dimension del nucleo 

2, 

rango infinito 


28. N(T) es el conjunto de las sucesiones constantes; T(V) es el conjunto de las sucesio- 
nes con limite 0 

29. d) {1, cos x, sen x} es una base para T(V); dim T(V) = 3 e) iV(T) = S f) Si 

T(f)=cf siendo c^0, entonces ceT(V) con lo que tenemos f(x)=c 1 +c 2 cos x+c 3 sen x; 
si Cj =0, entonces c = ir y f(x) = cos x + c 2 sen x, donde c 1 , c 2 son arbitrarias y 
no simultaneamente nulas; si Cj ^ 0, entonces c = 27T y /(x) = Cj, donde ci no es nula 
pero arbitraria. 1 
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2.8 Ejercicios (pag. 53) 


3. 

Si 

X 

= y, y = u 



4. 

Si 

X 

= U, y = -V 



5. 

No 





6 . 

No 





7. 

No 





8 . 

Si 

X 

r= log u, y = log V 



9. 

No 





10 . 

Si 

X 

= 11 — 1 , y = v — 1 



11 . 

Si 

X 

= l(v + u), y = l(v - 

-U) 


12 . 

Si 

X 

= sO + u), y = l(2v 

- u) 


13. 

Si 

X 

= w, y = v, z = u 



14. 

No 





15. 

Si 

X 

= U, y = \v, z = J-H> 


16. 

Si 

X 

= w, y — v, z = w - 

u — V 


17. 

Si 

X 

— u — 1, y = V — 1, 

z = w 

+1 

18. 

Si 

X 

rT 

1 

il 

1 

s 

li 

z — w 

- 3 

19. 

Si 

X 

= u, y = v — u, z = 

w — V 


20 . 

Si 

X 

= - v + w), y = 

\(v - w 

+ u); 


25. (S + T) 2 = S 2 + ST + TS + 7 2 ; 

(S + Tf = S 3 + TS 2 + STS + S 2 T + ST 2 + TST + T 2 S + T 3 

26. a) (ST)(x,y, z) = (x + y + z, x + y, x); (TS)(x,y, z) = (z, z + y, z + y + x); 

(ST - TS)(x,y, z) = (x + y, x - z, -y - z); S 2 (x,y, z) = (x,y, z); 

T 2 (x,y, z) = (x, 2x + y,3x + 2y + z)- 
(ST) 2 (x,y, z) = (3x + 2y + 2 , 2x + 2y + z, * + y + z); 

(TS) 2 (x,y, z) = (x + y + z, x + 2y + 2z, x + 2y + 3z); 

(ST - TS) 2 = (2x + y - z, x + 2y + z, -x + y + 2z); 

b) S~ 4 (u, v, >v) = (w, v, «); T~ J (u, v, w) = (u,v — u,w — v); 

(ST)~\u, v, w) = (w, v — w, u — v); (TS)~ 1 (i/, v, w) = (w — v, v — u, u) 

c) (T-I)(x,y, z) =(0,x, x + y); (T - l) 2 (x, y, z) = (0, 0, x); 

(T - I) n (x,y, z) = (0, 0, 0) si n > 3 

28. a) Dp(x) = 3 - 2x + 12jc 2 ; Tp(x) = 3x - 2x 2 + 12jc 3 ; (DT)p(x) = 3- 4x + 36x 2 ; 
(TD)p(x) = -2x + 24x 2 ; (DT - TD)p(x) = 3 - 2x + 12x 2 ; 

(T 2 D 2 — D 2 T 2 )p(x) = 8 — 1 92x b) p(x) — ax, a un escalar cualquiera 

c) p(x) = ax 2 + b, a y b escalares cualesquiera d) Todo p de V 

31. a) Rp(x) = 2; Sp(x) =3 — x + x 2 ; Tp(x) — 2x + 7>x 2 — x 3 + x 4 ; 

(ST)p(x) = 2 + 3x - x 2 + x 3 ; (TS)p(x) = 3x - x 2 + x 3 ; (TSfpix) = 3x - x 2 + x 3 ; 

(T 2 S 2 )p(x) = -a: 2 + jt 3 ; (S 2 T 2 )p(x) = 2 + 3x - x 2 + x 3 ; (TRS)p(x) = 3x; 

(RST)p(x) = 2 

b) N(R) = {p \ p( 0) = 0}; R( V) - {p \ p es constante}; N(S) = {p \ p es constante }; 
S(V) = V; N(T) = {O}; T(V) = {p | p( 0) = 0} c) = 5 

d) (TS) n = / - R; S n T n = I 

32. T no es uno a uno en V porque aplica toda sucesion constante en la misma sucesion. 
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2.12 Ejercicios (pag. 62) 


1. a) La matriz identidad / = («,*), siendo S tk = 1 si j = k, y $ jt = 0 si j ^ k 

b) La matriz cero O =(a jk ), en la que cada elemento a' lk — 0. 

c) La matriz (cd jk ), siendo ( r '> jk ) la matriz identidad de la parte a) 

_ foioool 


~) 

o 

o 

_J 


0 1 O' 

2 . a) 

b) 


Lo i oj 

0 0 L 


a) -5/ + Ij, 9i - 12 j 


c) 0 0 10 0 
0 0 0 1 0 


‘1 21 T3 01 -41 f"3 01 

b) Ll -lJ’ Lo 3 J c) L i jJ’ Lo 3 . 

r -2 01 [~4 01 

4. 

L 0 2j Lo 4 j 

'-1 -1 2 

5. a) 3 1 + 4 j + 4 k; dimension del nucleo 0, rango 3 b) 1—3 3 


2 0 -2 
1 -1 1 

2 1 0 


-1 -5 5 


a) T(4i — j + k) = (0, —2); dimension del nucleo 1, rango 2 b) 


0 1 
0 1 


0 1 3 

0 0-2 


d) e t =j, e 2 = k, e 3 = i, ^=(1,1), w 2 = (1,-1 


8 . a) (5,0, —1); dimension del nucleo 0, rango 2 b) 0 0 

J 1 _ 

c) = i, e 2 =i+j, Wj =(1,0,1), ^=(0,0,2), w 3 = (0,1,0) 

'1 r 

9. a) (-1, -3, -1); dimension del nucleo 0, rango 2 b) 0 1 

1 1 

c) e 1 =i, e 2 = j — i, ^=(1,0,1), w 2 =(0,1,0), w 3 =(0,0,1) 

n 2 

10 . a) e x — e 2 ; dimension del nucleo 0, rango 2 b) c) a = 5 b 

5 4 

'0 -ll f-1 ol 

11 . 

10 0-1 
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0 0 0 0 0 1 0 

0 1 0 0 0 0 4 

19. a) b) 

0 0 2 0 0 0 0 

0 0 0 3 0 0 0 



20. Eh'jase (x 3 , x 2 , x, 1) como base para V, 
de TD es 



0 

0 

0 

0 


0 

0 

2 

0 

c) 

0 

0 

0 

6 


0 

0 

0 

0 




‘o 

0 

-8 

o' 


0 

0 

0 

0 

-48 


0 

0 

0 

0 



0 

0 

0 

0 


(x 2 ,x) como base para W. Entonces la matriz 


6 0 0 0 
0 2 0 0 
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2.16 Ejercicios (pag. 70) 

~3 4~ 

1. B + C = 0 2 , AB = 

6 -5 


15 -14 

-15 14 


r 0 0 0 

0 0 

AC = , CA = 2 -8 4 , /4(2B - 3 C) = 

0 0 

L J 4 -16 8 


4 

—2 

16 

-8 

-28 

14_ 

30 

-28 

-30 

28 


2 . a) 


, a y b arbitrarios b) 


—2a a 
-2b b 


, a y b arbitrarios 


3. a) a — 9, 6 = 6 , c = 1, d = 5 b) a = 1, 6 = 6 , c = 0, d — —2 


6 . = 


7. = 


" —9 -2 —101 [-3 5 — 4 " 

4. a) 6 14 8 b) 0 3 24 

.-7 5 — 5j [ 12 -27 0_ 

1 n 

6 . = 

0 1 

cos nO —sen nO . 
sen nO cos nO 
n(n + 1)' 

1 " 

8 . A n = 

0 1 w 

0 0 1 

1 0 " 

9. 

-100 1 
a 6 

10 . , siendo bye arbitrarios y a es una solucion 
c ~ a j cualquiera de la ecuacion a 2 = —6c 

a 0 

11 . b) , siendo a arbitrario 


11 . b) 


L° 

1 0] f-1 0 


)] f-1 0] 6l 

’ „ . > y > siendo bye arbitrarios y a es una solucion 

0—1 c —a 


cualquiera de la ecuacion a 2 = 1 — be 


13. C 


, £> = 


3 3 19 

4 4 

43 25 

4 4 
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14 . 


b) (A + B )'- = A 1 + AB + BA + B-- (A + B)(A - B) = A- + BA 

c) Para aquellos que conmutan 


AB - B- 


2.20 Ejercicios (pag. 83) 


1 . 

2 . 

3. 

4 . 

5. 

6 . 

7. 

8 . 
9. 

10 . 


12 . 


13. 


16. 


(v, v, r) = (g, -l, g) 

Ninguna solucion 

(,v, v,r) = (I, -1,0) + /(—3, 4, I) 

(x, v,-) = (I, -1,0) + t( —3, 4, 1) 

(-v, v, z, n) = (I, 1,0,0) + /(I, 14,5,0) 

(.v, y, «) = (1, 8 , 0, -4) + /(2, 7, 3, 0) 

(,v, v, r, //, r) = /,(- 1 , 1 ,0, 0, 0) + i,( - 1,0, 3, -3, I) 

(v, v ,-,//) = (1, I, I, -1) +/,( — !, 3, 7, 0) + /.,(4,9, 0, 7) 
(.v, v,r) = (i, ji,0) + t( 5, 1, -3) 

a) (x, v, 2 , «) = (I, 6 , 3, 0) + 6(4, 11, 7, 0) + t.,( 0, 0, 0, 1) 

b) (x, r, r, //) = (, : V, 4, J», 0) + r(4, —11,7, 22) 


-I 

5 

-3 


' _ 5 
3 

-1 


0 

1 

0 

-3 

0 

9 


2 

-8 

5 

3 

0 


_ 1 

;) 


I 

-6 

4 


5 

3 J 


0 

0 

0 

1 

0 

-3 


14 . 


15 . 


14 


0 

0 

0 

0 

0 

1 


f 

0 

-1 

0 

1 

0 


8 

5 

2 

-2 

1 

0 

0 


1 

-2 

1 

0 


-2 

1 


2.21 Ejercicios varios sobre matrices (pag. 84) 


3. P = 


4 . 


~0 

0~ 


'1 0“ 


o 

1_ 

.0 

0_ 

’ 

.0 1. 

> y 

L c 1 — Cl\ 


, donde b y c son arbitrarios y a es una solucion 
cualquiera de la ecuacion cuadratica a 2 — a + be = 0 . 




764 Soluciones a los ejercicios 


1 

r 


'i 

r 


r- 1 

r 


'i 

-r 



"-i 

-r 


~-i 


-1 

i 

» 

i 

-i 

» 

L ■ 

i 

» 

i 

i 


» 

i 

-i_ 

> 

-i 

i 


i 

-\ 


"-i 

r 

-i 

-i_ 


-i 

-i 


Capitulo 3 

3.6 Ejercicios (pag. 97) 

1. a) 6 b) 76 c) a 3 - 4a 

2 . a) 1 b) 1 c) 1 

3. b) (b — a)(c — a)(c — b){a + b + c) y (6 — a)(c — a)(c — b)(ab + ac 4- be) 

4. a) 8 (b) ( b — a)(c — a)(d — a)(c — b)(d — b)(d — c) 

c) (b - a)(c - a)(d - «)(c - b)(d - b)(d - c)(a + b + c + d) 

d) a(a 3 — 4)(a 2 — 16) e) -160 


7. F' = 

X X X 

Si Si S3 

+ 

X h X 

Si Si Si 

+ 

X fi X 

g\ & 2 #3 


K h 2 h 3 


h 3 h 3 


hi h 2 ^3 


8 . b) Si F = 

X X X 

X X X 

entonces F' = 

X fi X 3 

X X X 


X X X 


fill rill rill 

j 1 / 2 J 3 


10 det A = 16, 


det C4- 1 ) = ~ , 



3.11 Ejercicios (pag. 104) 

6 . det A = (det 5) (det D) 

7. a) Independientes b) Independientes 


i “I i 
o I -! 

0 0 i 

c) Dependientes 


3.17 Ejercicios (pag. 116) 








' 109 

113 

-41 

-13" 



2 

-1 

f 






' 4 -3~ 

b) 

-6 

3 

5 

c) 

-40 

-92 

74 

16 

--2 1 . 





-41 

-79 

7 

47 



-4 

-2 

2 












-50 

38 

16 

20 
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2. a) 


l[~ 4 -2‘ 

2 _—3 1 . 


b) - -1 


2 -6 -4 
1 3 -2 

1 5 2 


' 109 

-40 

-41 

-50' 

113 

-92 

-79 

38 

-41 

74 

7 

16 

_—13 

16 

47 

20 . 

2=3, 

A = 

±t 



5. a) *=0, y- 1, z = 2 b) x = 1, j = l, z = -1 

r -i y ^ l - 

* -*i y -yi 2 -*i 

xj y\ z i i 

6. b) det * 2 - *i - yi z 2 ~ z i = 0; det 

*2 y 2 *2 1 

*3 - *1 73 - yi Z Z - *1 

1*3 73 z 3 1. 

(x - Xj) 2 + (y - Ji) 2 (x - Xj) (y - ^)' 

c) det (x 2 - x x ) 2 + (y 2 - yi ) 2 (x 2 - x,) (y 2 - = 0 ; 

_(x 3 - X!) 2 + (y 3 - yi ) 2 (x 3 - Xj) (y 3 - _y x )_ 

"x 2 +j 2 x j r 

*i +7? *i 7i 1 
det =0 

A + y \ *2 72 1 

*3 + 73 *3 73 1 . 


Cap'itulo 4 


4.4 Ejercicios (pag. 125) 

5. Autofunciones : /(/) = O a , donde C ^ 0 

6 . Ei polinomio constante no cero 

7. Autofunciones ;: /(/) = Ce t,x , donde C ^ 0 

8 . Autofunciones : /(/) = Ce' At2,x , donde C #0 

0. Los autovectores pertenecientes a X = 0 son todos sucesiones constantes con limite 

a ^ 0. 

Los autovectores pertenecientes a X = — 1 son todos sucesiones no constantes con 
limite a = 0 
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4.8 Ejercicios (pig. 132) 


Autovalor 

Autovectores 

dim £(A) 

(a) 

1,1 

(a, b) 7 * (0, 0) 

2 

(b) 

1,1 

f(l,0),/ *0 

1 

(0 

1,1 

r(0, 1), t t* 0 

1 

(d) 

2 

/(l.l) t 7*0 

1 


0 

t( 1, -1),/ 7* 0 

1 


1 + yfab 

tl\]a, s/b)>t 7*0 

1 


1 — y/ab 

-y/b), t 7* 0 

1 


3. Si el campo de escalares es el conjunto de los numeros reales R, entonces solamente 
existen autovectores reales cuando sen 6 = 0, en este caso habrd dos autovectores iguales, 
A t = A 2 = cos0, donde cos0 = 1 o — 1 

En este caso todo vector no cero es un autovector dim E(Aj) = dim E(A 2 ) = 2. 

Si el campo de escalares es el conjunto de los numeros complejos C, entonces los auto¬ 
vectores son Aj = cos0+ i sen0, A 2 = cos0— i sen0. Si sen0 = 0, son reales e iguales. Si 
sen0 y* 0 son complejos conjugados distintos; los autovectores pertenecientes a A t son 
t{i, 1), t y* 0; los pertenecientes a A 2 son t(l,i), t yt 0; dim E(A t ) = dim£(A 2 ) = 1. 


4. 


a b~ 
c —a 


, donde bye son arbitrarios y a es una de las soluciones de la ecuaci6n 


a 2 = 1 — be. 


5. Sea A = 


a b~ 

c d 


, y sea A = (a — d) 2 + 46c. Los autovectores son reales y distintos 


si A > 0, reales e iguales si A = 0, complejos conjugados si A < 0. 
6. a = b = c = d — e = f=\. 


Autovalores 

Autovectores 

dim E(A) 

(a) 

1,1,1 

t(0, 0, 1), t 7* 0 

1 

(b) 

1 

t{l, -1,0), t 7*0 

1 


2 

/(3, 3, -1), / y* 0 

1 


21 

til, l, 6), t t*0 

1 

(c) 

1 

to, -1,3), / *0 

1 


2,2 

tO, 2, -1),/ *0 

1 


8. 1, 1, —1, —1 respectivamente para cada matriz 
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4.10 Ejercicios (pag. 139) 

2. a) Autovalores 1,3; C — 

(b) Autovalores 6, — 1; C — 


-2c O' 


c d 
"2 a b 


, donde «/ # 0 


, donde ab ^ 0 


_5 a —bj 

c) Autovalores 3, 3; si existe el no singular C, entonces C~ X AC = 37, siendo 
AC = 3C, A = 3/ 

d) Autovalores 1, 1; si existe el no singular C, entonces C~ 1 AC = I, siendo AC = C, 
A = / 

3. C^A^B. 

4. a) Autovalores 1, 1, —1; autovectores (1,0, 1), (0,1,0), (1,0, -1); 

'l 0 f 


C = 


0 


1 0 


1 0 -1 

b) Autovalores 2, 2, 1; autovectores (1,0, —1), (0, 1, —1), (1, —1, 1); 

10 1 

C = 0 1-1 

-1 -1 1 

5. a) Autovalores 2, 2; autovectores 1(1,0), t ^ 0. Si C = 

~2 0 


a 6‘ 
-b 0 


M0, 


entonces C -1 /1C = 


1 2 


b) Autovalores 3, 3; autovectores 1(1,1), 1 # 0. Si C = 
"3 O' 


a b 
a + b b 


, b 0, 


entonces C MC = 


1 3 


6 . Autovalores 1, 1, 1; autovectores 1(1, —1, — 1), 1 7 s 0 


5.5 Ejercicios (pag. 146) 


Capitulo 5 


3. b) T* es hermitiana si n es par, si n es impar es anti-hermitiana 

7. a) Simetrica b) Ni lo uno ni lo otro c) Simetrica d) Simetrica 

9. d) Q(x 4- ty) = Q(,x) + tt'Q(y) + t{T{x),y) + t{T(y), x) 


5.11 Ejercicios (pag. 154) 

1. a) Simetrica hermitiana 



768 


Soluciones a los ejercicios 


b) Ninguno de los cuatro tipos 

c) Anti-simetrica 

d) Anti-simetrica y anti-hermitiana 


4. b) 


'cos 0 sen fj 


[sen 0 —cos 0 _, 

5. Autovalores A x = 0, 2 2 = 25; autovectores ortonormales « x = i(4, -3), 
~ 4 3 - 


1 

C = 5 


-3 4 


6 . Autovalores 4 = 2 i, /. 2 = —2/'; autovectores ortonormales 

"1 1 

—^ (1,0. C=- T J 

V 2 V 2 


1 1 1 
= u 2 =—(l,i). C= — 


—i i 


7. Autovalores / x — 1, A 2 — 3, 2 3 = —4; autovectores ortonormales 

--^0,0,3,, ---4(3,2,-!), ".-4;<3,-3,-D 


c = 


VlO 

1 3 3 ' 

yfiO a /14 ^35 

2 -5 

° Vl4 a/35 
3 -1 -1 

L/io Vi 4 V35J 


8 . Autovalores 4 = 1, A 2 = 6 , A 3 = —4; autovectores ortonormales 


1 


«x = i(0, 4, -3), « 2 = — (5,3,4), « 3 =-— (5, -3, -4). 


C = 


a/50 


V 50 
0 5 5' 

4 a/2 3 -3 

-3a/2 4 -4 


a/50 


9. a), b), c) son unitarios b), c) son ortogonales 

11. a) Autovalores 2 X —ia, A 2 = —/a; autovectores ortonormales 

1 1 ‘ 

i —i 


7 - ( .,o, 


«2 = -7= (1. - 0 . b) C = — 

V 2 V 2 


« 2 = i(3, 4). 
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5.15 Ejercicios (pag. 166) 

~4 2 


1. a) A = 

d) C = 

2. a) A — 


2 1 
1 


1 1 

b) = 0, A 2 = 5 c) Ui — (1, 2), if 2 = (2, 1) 


Vs 


1 2 

-2 1 


0 i 


b) 2^ — - 2 -, A 2 — 2 


c) « 1 =^=( 1 , 1 ), « 2 = —(1, — 1) d) C = 

V 2 V 2 V 2 


1 1 
1 -1 


3. a) A = 


1 1 
1 -1 


b) Aj = ^2, A 2 = —y/l 
c) If! = 1(1 + V 2 , 1), «2 = /(-l, 1 + V 2 ). donde t = I/V4 + 2^2 

1 + V 2 -1 


d) C =t 

4. a) A = 


. 1 1 + V2J 

34 -12 

-12 41 


, donde t = 1/V4 + 2V2 
b) A t =50, A2=25 


1 1 1 

c) «!=-(3, -4), « 2 =-(4,3) d) C = - 


3 4' 
-4 3 


5. a) A = 


1 I 1 

2 0 | 

li I 0j 


b) A 2 — 0, A 2 — 2 > A 3 — — J 


0 ...2.(i,-2= <2. 


c) C = 


6. a) ^4 = 


1 

V6 


r v ' 2 

2 O' 

-V 2 

1 V3 

.-V 2 

1 -V3_ 

0 2 ' 


1 0 

b) 

0 



b) Aj = 1, A 2 =3, Ag= -2 
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c) «!= (0,1,0), « 2 =-^(2,0,1), „ 3 =-L(i >0 ,-2) 


d) C = 


7. a) A = 


0 2 1 ' 

yjl 0 0 

0 1 -2 

3 2 4 


Vs 


2 0 2 
4 2 3 


b) Aj = A 2 = -1, A 3 = 8 


-72 (1.0, -1), 

V2 

11 

3 

1 

3V2 

1 

1_ 

2sJ2 

0 4 

V2 


T 

1 

_1 

2 Va 


3V2 


d) C = —- 


8. Elipse;. centro en (0, 0) 

9. Hiperbola; centro en(—§, — f) 

10. Parabola; vertice en (j^, —]|) 

11. Elipse; centro en (0,0) 

12. Elipse; centro en (6, —4) 

13. Parabola; vertice en (^ 5 -, J|) 


14. Elipse; centro en (0,0) 

15. Parabola; vertice en(|, |) 

16. Elipse; centro en( —1,-|) 

17. Hiperbola; centro en (0,0) 

18. Hiperbola; centro en ( — 1,2) 

19. -14 


5.20 Ejercicios (pag. 174) 

8. a = ±J->/3 


13. (a), (b), y (e) 


6.3 Ejercicios (pag. 178) 

1. y = e 3x - e ix 

2. y = fx 2 +i* 5 

3. y — 4 cos x — 2 cos 2 .* 

4. Cuatro veces la cantidad inicial 

5. f(x) = Cx n , or fix) = Oc 1/n 


Capitulo 6 

6. b) j = e 4 * - e ~ x3/3 

1. y = c^ 2 * + c 2 er 2x 

8. y = c x cos 2* + c 2 sen 2x 

9. y = ^(cj cos 2* + c 2 sen 2x) 
10. y = ^(cj + c 2 x) 

CsennwAr (« = 1, 2, 3,. ..) 


k = « 2 ^ 2 ; AW = 

a) / - y = 0 

b) /' - 4/ + 4_y 

c) y" + / + iy = 0 

d) y" + 4y = 0 

e) /' - y = 0 


11 . 

13. 
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14. j=iV 6 > y" = -\ly = -4/6 


6.9 Ejercicios (pag. 190) 

1. _y = Ci + c 2 e~ x + c 3 e 3x 3. y = c t + (c 2 + c 3 x)e~ 2x 

2. y — c 2 + c 2 e x + c 3 e~ x 4. y = (c x + c 2 x + CgX 2 )^ 

5. y = (c r + c 2 x + c s x 2 + c t x 2 )e~ x 

6. y = c x c 2a: + c 2 e~ 2x + c 3 cos 2x + c 4 sen 2x 

1. y = e^ 2x {c 1 cos /2x + c 2 sen /2x) + e~ V2x (c 3 cos/2x + c 4 sen / 2.x) 

8. y = c^6 x + e~ x,2 (c 2 cos |/3x + c 3 sen | /3x) 

9. y = 6~ x [(Cj + c 2 x) cos x + (c 3 + c 4 x) sen x] 

10. y = (c 4 + c 2 x) cos x + (c 3 + c 4 x)sen x 

11. y = c x + c 2 x + (c 3 + c 4 x) cos /2x + (c 5 + c 6 x)sen / 2x 

12. j = Cj + c 2 x + (c 3 + c 4 x) cos 2x + (c 5 + c a x) sen 2x 


13. /(x) = (c m * — cos mx — sen mx) 

15. a) y il) — 5 y" + Ay = 0 

b) /" + 6 y" + 12/ + Sy = 0 

c) / 4) — 2 y" + y" =0 

d) /*> - 2/ + / = 0 


e) /«> -2/ 4 > + /' =0 

f) y w + 8/' + 33/ + 68/ + 52 y 

g) / 4) - 2y" + y = 0 

h) / 8) + 4/ = 0 


6.15 Ejercicios (pag. 204) 


1. yx — —2x — x 2 — jx 3 5. y x 

2. jx=ix e 2 - 6. >'! 

3- yi — (.x f)e x 7. 

4. = | sen x 8. 


9. 50^! = (11 — 5x)e x sen 2x + (-2 — 10x)e* cos 2x 
10. yx = -(fx +fx 2 +*x 3 )e-“ 


= JxV’ + e ix 
— hxe x 


= x cosh x 

24* e 


yTripO-X 

1Z yi= ww 

15. b) 2D c) 3D 2 d) nD n ~ 1 

1 f e~® 1 f e* 

16. _y = Ae? + fie * + - e* — e/x — - — rfx 


17. y = (A + |x) sen 2x + (B + | log |cos 2x|) cos 2x 

18. y = Ae* 4- Be~ x + f~5ecx 

19. y = (A + Bx)^ + e‘ x — xe* J e‘ x dx + e x J xe* 1 dx 
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1 l r e ~ x i r e ~ 2 x 

2.0. y = - - log |*| + - e* I — dx - - e 2x \ — dx 

+ 24 e ~ dx + ^ + 5e2X + Ce4a: 


6.16 Miscelanea de ejercicios sobre ecuaciones diferenciales lineales (pag. 206) 

1. u(x) = 6(e ix - e~ x )/5 ; v(x) = e x — e~ 5x 

2. u(x) = $e 2x -* sen 5* ; v(x) = |e~ 2a: - , 'sen 3* 

3. u{x) = e- xi ; Q(x) = 4* 2 + 2 

5. = (/4 + ArV + (* 2 - 2* 4- 2)e 2 * 

6. y = /le 4 * j' e ~ ix ~ x3 ' 3 dx + Be ix 

7. y = Ax' A + .8*-^ 

8. / = Ae x + Bx 2 e~ x — x 

9. y = ^(* 2 - 2) + £/* 

10. y = *- 2 K + B {x - l) 3 + I* 3 + f* 2 - |* + | - (* - I) 2 l 0 g | x _ ih 

11. a = 1, -1; _y = [Ae ow + Be~ gM ]lx 


6.21 Ejercicios (pag. 218) 

2. /(*) = Ul (x) (a = 1) 

3. a) A — (a — b)/2, B = (a + b)/2 


b) 


d f dyl 

dt ^ ~ l) Tt\ ~ “( a + ^ = °» donde a = 1 o -2, y * = (t + l)/2 

00 

^ i — l) m 2 v 


4 . «!(*) = 1 + y ( —l) m 2 m - 2 ) ■ • • (a 2m + 2 ) 

(2m)! 


x 2m para todo *; 


u 2 (x) = * + V ( —l) m 2 m — -—- 3) ' ' ' ^_ 2m + ^ ^m+i 

^ (2m + 1)! * 


para todo * 


2 (_l)rrc 

(3m 4- 2)(3m - 1) • • ■ 8 • 5 ^ para todo 

m =1 

u 2 (x) = * _2 f 1 + 2 3 „ ( Jc 3 " j para todo x A 0 
6. , = *3/1 + J ^LI 2)(0£ - 3) • • • (a - n - 1) 


n\(n + 3)! 


11. b) f(x) = £/>„(*) + fp 2 ( x ) + -SgPtix) 
15. b) -2- 




x n I para todo a: 


4 n 2 - 1 
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6.24 Ejercicios (pag. 231) 

s / 2 / cos x \ 

5. (—+™*) 


9 . a) y = x'^M.^x^) + c*/- W (J* M )] 

b) j = x'^fo/i./jx 2 ) + c*/_ u (ix 2 )] 

c) j = x' s [c 1 J (t (2ax 1+m/2 ) + c 2 /_ a (2ax 1+m/2 )], donde a = l/(w + 2), con tal que 
l/(m + 2 ) no sea entero; si no, sustituir la / correspondiente por K 

d) J =x'^[c 1 y a (|x 2 )+c 2 /_ [1 (Jx 2 )] > donde a = \/2/8 

10. j satisface x 2 y" + (1 — 2 c)xy' + (a 2 b 2 x 2b + c 2 — ci 2 b 2 )y = 0 

a) 7 = x-*M s (2x*) + c 2 * 5 (2x'^)] 

b) _K = x-^r Cl J 5i (x) + CzJ_i A (x)\ 

c) y- x-'-iCjJiiixH) + cA(|*«)] 

d) j = xM 0 (2x^) + c 2 K 0 {2x*)] 

11. a = 2, c = 0 


i2- ^ = 2 y =J ° {2x ' A) six>0 

n—0 


13. b =(p 0 - a 0 )la 0 , c = ? 0 /«o 

14. 7 = x l/ * 



16. n 0 (x) = cos x; «]Xx) = J — i cos x — J cos 2 x 


7.4 Ejercicios (pag. 241) 

k -1 

3. b) (P k )’ = J P m P'P k ~ 1 ~ m 

m =0 


Capitulo 7 


7.12 Ejercicios (pag. 251) 

1. a) A- 1 =21 -A, A n =nA - (n - 1)/ 


b) e tA = e*(l - t)I + te*A 


e l 


"1 O' 
t 1 
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2. a) A- 1 = 1/ - \A, A" = (2" - \)A - (2" - 2)1 


b) e tA = (2e‘ — e 2t )l + (e' a — e‘)A = 


3. a) A» = 1+ [- 1)n i + Lzll»: A 


b) e tA — (cosh/)/ + (senh t)A = 


4. a) A- 1 = A, A n 


2 2 

cosh t senh / 
senh / cosh t 
1 +(-D" l-(-l) n 


/ + 


b) e tA = (cosh /)/ + (senh t)A 
5. b) e tA — e° ! 


0 


0 e l 


cos bt sen bt 
—sen bt cos bt 

7. e A <‘> = I + ( e - 1 )A(t ); (<-*<»)' = (e - 1 )A'{t) = 

[0 e 

L° °. 

8. a) ,4»=0 si a23 


e A ^A\t) = 


; A\t)e A «> = 


0 1 
0 0 


b) e‘ A = I + tA + ^ t 2 A 2 = 
9. ;a) = A si n > 1 

b) = / + («* — l)/4 = [ 0 


4 / f +1/ 2 
0 1 / 

0 0 1 

1 e‘ — 1 e‘ — 1 


e‘ - 1 


10. a) A 3 = 4 A 2 - 5A +2/; A n = 

~e 2t 0 O' 

b) e iA = 0 e* 0 

_ 0 te‘ e\ 

11. e tA — I + tA + §/ 2 .4 2 


.0 0 1 
’ 2 " 0 0 
0 1 0 
0 n 1 
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13. e A e 1! 


~e 2 -(e - 1) 2 ~ 

0 1 




(e - l) 2 ' 

1 


e A+n = 


0 


O' 

1 


7.15 Ejercicios (pag. 260) 

1. e tA = \ (3e* — e 3t )I + \ (e 3 ‘ — e t )A 


2. e tA = (cosh sj5 l)I 4 ——r (senh^/5 t)A 
v 5 


3. e tA = |e‘{(/ 2 -2/4- 2)/ 4- (-2/ 2 4- 2/)/l 4- / 2 /l 2 } 

4. = (3r‘ — 3e~ 2 ‘ 4- e~ 3 *)/ + (fe 1 — 4e~ 2 * 4- ;je~~ 3 *)/l 4- (|e~* — e~ 2 ‘ 4- \e~ 3t )A 2 

5. e*' 1 = (4e* - 3e 2 * 4- 2le 2t )l + ( 4e 2 ‘ - 3 te 2t - 4e‘)A + (e* - e 2t 4- te 2t )A 2 

6. e tA — (4e‘ — 6e 2t 4- 4e 3t — e 4 ‘)l 4- (— ’ 3 3 e* 4- \ u e 2t — 7e 3t 4- Ve 4 *)/) 

4- (fe* — 4c 2 * 4- !e 3 * — e 4 *)/4 2 4- ( — 3 e* 4- - 2 e 2 * — |e 3 ‘ 4- ee 4i M 3 

7. b) e*- 1 = ^*{(6 - 62/ 4- 3A 2 / 2 - A 3 / 3 )/ 4- (6/ - 6A/ 2 4- 3A 2 / 3 )/! 4- (3/ 2 - 3A/ 3 )^ 2 


4- / 3 /l 3 } 

8. yi - C 1 cosh y/S ‘ + 


Ci 4- 2co 2cj C 2 / 

senh^/5/, j 2 = c 2 cosh 5 / 4- -——-—senh^/5/ 


V5 


V5 


9. = e‘(cos 3/ — sen 3/), _y 2 = e‘(cos 3/ — 3 sen 3/) 

10. jx = e 2! 4- 4/e 21 , y 2 — —2c* 4- e 2t + 4/e 2 -*, y 3 = — 2e* 4- 4e 2 * 

11. y 1 =c 1 e 2t , y 2 = c 2 e*, j 3 = (c 2 /4-c 3 )e* 

12. j! = 3e ~* — 3e~ 2 * 4- e 3 *, = —3e“* 4- 6e~ 2 * — 3e 3 *, y 3 = 3e * — 12e -2 ‘ 4 - 9e' 

13. y 3 = e 5 * 4- 7e _3 ‘, _y 2 = 2e 5 ‘ — 2e~ 3 *, y 3 = — e 5 * 4- e~ 3 * 

14. y 3 = — £e* 4- e 2 * 4- £e 3 *, y 2 = e 2 * + e 3 *, j 3 = e 3 *, = e 4 ‘ 

15. yi = 2e 2 * - 1, = 2e 2 ‘ - / - 2, _y 3 = 2e 2 ‘, y 4 = e 2t 


7.17 Ejercicios (pag. 264) 

2. c) y x = (6 — lje* 4 2(c 4 1 — b)xe x 4- 1, y 2 = ce* + 2(c 4- 1 — b)xe x 
4- yi = -Je* - ie 4 * 4- ^e 2 ‘, j 2 = fe* - |e 4 * + |e 2 * 

5. a) = B 3 =AB, B 2 = ^ A 2 B,. .. , B m = ^ A m B 
b) B = -m\ (/4 -1 ) m+1 C 

/ 1 1 \ 3 r 1 

6 . a) Y(/) = I / 4- tA 4- - / 2 /4 2 4- 7 t 3 A 3 1 B, donde B - —6A 4 C =- 

\ 2 6 / 128 j 

Esto nos da la solution particular y x = y 2 *= —xf s “ Af — i'V 2 — l ^ 3 
b) y 3 = _y 2 = — 1 T 8 3 V — ts^ 2 — i* 3 4- IMe 41 

7. E = B, F — - (AB 4- C) 

(X 


-3 f 


8. a) = —cos2/ — J sen2/, y 2 = sen2/ 
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b) y\ = 2 cosh 2t + f senh 2? - cos 2t — \ sen It, jy 2 =cosh It + |senh It — |sen 2t 
9. JjO) = e 2x + e 3x - e x , y 2 (x) = ~2e 2x - e 3x + 3e x 

10. }\(x) — 2*5 e 1 — 3«e 2x + (cj — l o§e“ 4x + (fo — c, — c 2 )ac~ 4;c , 

y 2 (x) = he x + 3 V 2 * + (c 2 - + (ci + c 2 - H)** -4 * 

11. V'ilx) = «r te (2 cos x + sen x) + He x - ft, j 2 (a) = <r te (senA + 3 cos x)- 1 \e x +r 7 

12. y\(x) = e~ x (x 2 + 2x + 3) + a: 2 - 3a + 3 , j 2 (a) = e~ x {-2x - 2) + a, 
j 3 (x) = 2e~ x + x - 1 


7.20 Ejercicios (pag. 272) 

4. c) Y(x) = e x e' AxiA B 

“ CO 

5. Si A(x) =2 x k A k , entonces K(x) = B + xC + T x ; -'£ /; , 

*=0 i»=2 

donde 4- 2)(Ar + \)B k 2 = ^ A r B k ^ r para & > 0. 


7.24 Ejercicios (pag. 283) 

1. a) Y(x) = e* 

b) YJx) = 2e* - 2^ — si n es impar ; Y n (x) = ^ ^ si n es par 

*=® *to K ' 


x 2 a : 5 x 8 x 11 

3 W - 2 + ^ + JgQ + ^4 q5 
y4 y7 y-10 

3. y lW -* + - +r4+ _ 

: 3 4x 7 8x 9 184 a 11 4a: 13 


+ 


4. r 8 (x) = - + — + — + r - 

3 3 63 405 51975 12285 

, N „, . 2X 3 x* 2x 3 x 7 

5. a) Y. ;(x) = 1 + x + x 2 + — + — + — + — 

3 o 1 j 63 

b) M = 2 ; c = | 

, w , , ,4^ 7a: 4 6x 5 

c) F(x) = 1 + x + x 2 + — + — + — + ••• 

3 6 5 

, , v . , a: 3 2a: 5 17a: 7 38a: 9 134a: 11 4a: 13 a: 15 

3 15 315 2835 51975 12285 59535 

w , t a" 3 2a: 5 17a: 7 62a 9 

d) Y(x) - tg a — a + + — + — + + • • ' Para |a| < - 


3a 5 


3a 4 6a 5 3a 7 3a 8 


q v T i 2 i 3 , ^ , , ~w t \ „ „ - > X- OX" AX AX" 

. 3(A) 2 + x +x +20+10’ Za(x) ~ 3x +“+“+^' + 77: 


28 40 
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Soluciones a los ejercicios 


n v / \ c X* X e 2x 7 JC 9 

W - 5 + * + Yi + 6 + a + 72; 

z, w -, + ? + ^ + ^ + ^ + Hi’ + zi 1 

3 3 9 x 8 ^ 324 + 264 

10. d) Y n (x) = 0 ; lim Y n (x) = 0 

n —►oo 

y2 


e) Y n (x) = 


jc 2 si * > 0 
— x 2 si x < 0 


; lim Y n (x) - 


x 2 si x > 0 


2x n 

1 " 


f) r„(-c) = — ; lim Y n (x) = 0 

n-+ oo 

f a: 2 si JC > 0 

g) y„(Ar) = { ^ , „ ; lim Y n (x) 


-x 2 si x < 0 


—x 2 si JC ^ 0 

x 2 si x > 0 
-x 2 si x ^ 0 


Capitulo 8 

8.3 Ejercicios (pag. 300) 

2. Todos abiertos excepto d), e), h), y j) 

3. Todos abiertos excepto d) 

5. e) Un ejemplo es la coleccion de todas las 2-esferas B(0; 1 /k), donde 

6. a) Abierto y cerrado b) Abierto y cerrado c) Cerrado d) Abierto 

f) Ni abierto ni cerrado g) Cerrado h) Ni abierto ni cerrado 
j) cerrado k) ni abierto ni cerrado 1) Cerrado 

8. e) Un ejemplo es la reunion de todos los conjuntos de la forma S*= {x | 
para k= 1,2,3,... Su reunion es la esfera abierta B(0; 1) 

10. No 


8.3 Ejercicios (pag. 306) 

1. a) Todo(;e, y) 

b) Todo (at, y) ^ (0, 0) 

c) Todo ( x , y ) con y ^ 0 x2 

d) Todo(x, j) con y ^ 0 y — 9* ^ + kir (k = 0, 1, 2,. ..) 

e) Todo (x, y) con x ^ 0 ^ 

f) Todo (a:, y) s* (0, 0) 

g) Todo (x,y) con xy 9 * 1 

h) Todo (x,y) 9 * (0,0) 

i) Todo(x, y) 5 * (0, 0) 

j) Todo(x, y) con j 7 s 0 y 0 <, x <, y o y <, x <,0 

5. lim f(x,y) no existe si x 9 t 0 

6. (1 - m 2 )/(\ + m 2 ); No 

1 • y — ix 2 ; / no es continua en (0, 0) 


k= 1,2,3,... 
e) Cerrado 
i) cerrado 

W<1-1/*} 



Soluciones a los ejercicios 


778 

8. /(0, 0) = 1 

8.9 Ejercicios (pag. 312) 


1- f'(x;y) = a- y 

2. a) f'(x; jO = 4 ||x|[ 2 x • 

b) Todos los puntos de la recta 2 jc + 3y = -fw 

c) Todos los puntos del piano x + 2y + 3z = 0 

3. /'(*; y) = x ■ T(y ) + >> • -T(jc) 


df df 

4. = 2x + y 3 cos (xy) ; = 2_y sen (xy) + xy 2 cos (xy) 

5. fa=x/(x 2 + /)*; |=_y/(* 2 + /)V< 

6 - = /V(* 2 + J 2 ) 54 1 = —xy/(x 2 + /)5* 

df df 

7. £ = -2yl(x-y) 2 ; £ = 2x K x - y) 2 


8- D k f(x) = a k , donde a = («!,..., «„) 


9. 

10 . 


/),/(*) = 2 2' a kjXj 
i=i 

df df 

fa = 4x* - 8*/ ; ^ = 4/ - 8x 2 _y 


11. ^ = 


df 


2x 


dy 

df 2 y 


12 . 

13. 

14. 

15. 

16. 

17. 

18. 


dx jc 2 + y 2 dy x 2 + y 2 

df 2x df 1 

_ = __ se n(* 2 ); _ = _- CO s(* 2 ) 

df 2x x 2 df x 2 x 2 

— = — sec 2 — ; k- =- - sec 2 — 

ox y y dy y y 


df 


df 


1 


dx x 2 + y 2 ’ dy x 2 + y 2 

df _ 1 +/ df l +x 2 


dx 1 + x 2 + y 2 + x 2 y 2 ’ dy 1 + x 2 + y 2 + x 2 y 2 

df 

dy 


ft = y 2 x v2 1 ; ft — 2yx v2 log x 


dx 

df _____ 

dx 2 y/xly—x)’ dy 2yyjy—x 


df y/x 


— — 3 . 
“ 2 
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19. a=6 = l 

22. b) Un ejemplo es /(x) = x • y, donde y es un vector dado no nulo 


8.14 Ejercicios (pag. 320) 

1. a) (2x + y 3 cos xy)i + (2 y sen xy + xy 2 cos xy)j 

b) e? cos yi — e* sen yj 

c) IxfzH + 3 X yz*j + 4x 2 fz 3 k 

d) 2xi — 2 yj + 4 zk 

^ 2x 4 y . 6 z 

6) x 2 + 2 y 2 - 3z 2 * + x 2 + 2/ - 3z 2y " " x 2 + 2/ - 3z 2 * 

f) y z x v ’ , ~ 1 i + 2 / 4 x»' log xj + fx v ‘ log x log yk 

2. a) -2/V6 

b) 1/V6 

3. (1,0), en la direccion de i; ( — 1,0), en la direccion de —/ 

4. 2i + 2j ; 1/ 

5. (a, b, c) = (6, 24, — 8) o (—6, —24, 8) 

6. El conjunto de puntos (x, y) de la recta 5x — 3y = 6 ; V/(a) = 5i — 3/ 
8. c) Si 

d) f(x,y,z) = |(x 2 +y* + z 2 ) 

11. b) implica a) y c); d) implica a), b), y c); f) implica a) 


8.17 Ejercicios (pag. 327) 


1. b) F\t) = g ur'(/)p + 2 ^ x\t) Y'(t ) + g (r'(/)] 2 + ^ x"(0 + 0 r«) 

2. a) F'(t) = 4/ 3 + 2/; F"(/) = 12/ 2 + 2 

b) F'(/) = (2 cos 2 / — l)e cos * ^ 1 cos(cos /sen 2 /) + (3 sen 3 / — 2 sen/)e cos * san 1 sen(cos /sen 2 /) ; 
F"(t) = (5 cos 8 / — 3 cos 4 / — 4 cos 3 / — cos 2 / — 4 cos /)e c08<scn( cos (cos /sen 2 /) 

+ (14sen 3 / — 12sen 5 / — 4sen / +7 cos / — 9 cos 3 /)<? cos 15001 sen(cos /sen 2 /) 


, 2e 2t exp (e 21 ) 2e~ 21 exp (e~ 2t ) 

C) F W = 1 + exp (e 2t ) + 1 + exp (e~ 2t ) 


F"(t) = ■ 


r ' ' r > ' 

4(1 + e 21 + exp (e 21 )]e 21 exp (e 2i ) 4(1 + e~ 21 + exp (e~ 2t )]e~ 2t exp (e _2t ) 

[1 + exp (e 21 )] 2 ri -4- exn <V- 2 ‘!1 2 


[1 + exp (<r 21 )] 2 


3. a) -f 

b) x 2 — y 2 

c) 0 

4. a) (1 + 3x 2 + 3y 2 )(xi + yj) — (x 2 + y 2 ) 1 ^, o cualquier producto de este por un escalar 
b) cos 6 = — [1 + (1 + 3(x 2 4- y 2 )) 2 ]~H j cos 0 —► — \ \'2 cuando (x, y, z ) -> (0, 0, 0) 
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Soluciones a los ejercicios 

5. U(x,y) = 2 log (x~ + y 2 ); V(x,y) =arctan (y/x) 

6. b) No 

8. x/x 0 + yly 0 + zlz 0 = 3 

9. x + y + 2z = 4, x — y — z — —1 

10. c = ±\/3 


8.22 Ejercicios (pag. 336) 
df 

1 . b) ^ = — 2 xsen (x 2 + y 2 ) cos [cos (jt 2 + y 2 )]e "" [c03 (x ' 1 ' + ^ 2 )1 


5 . 


d_F 

dx 


2. =r 


2 du 2dv ’ 


dF _ _ 1 df Idf 
dy 2 du ^ 2 dv 


3. a) 3 - = 


dF 

ds 


df dX df d Y 
dx ds + dy ds ’ 


dF = dfdX dfdY 
dt dx dt dy dt 


c) 


d 2 F d 2 fdXdX d 2 f (dxdY dXdY\ d 2 fdYdY df d 2 X 

^ ~ I + ~i -4* 


ds dt dx 2 ds dt 


4. a) 3 - = 


d_F 

ds 


d l + t d l. 

dx + dy’ 


dx dy \ ds dt + dt ds ) + dy 2 ds dt 
dF _ df df 


df d 2 Y 

dx ds dt + dy ds dt 


dt dx +S dy’ 


d 2 F 

ds 2 


d -l + 2 t *L 

dx 2 + dx dy 


* d2 f, 


dfF _ d 2 f d 2 f 
dt 2 ~ fa 2 +2s dJTy 

dF df idf 
b) ds 1 dx + t dy ’ 


, d V 

'df’ 


d 2 F 


_ 

ds dt dx 2 ^ ^ dx dy 


d 2 f 


+1 2 — 

+ df 

d 2 f df 

+ St df + dy 


dF 

Jt =S d~x 


s df 
t 2 dy ’ ds 2 


d 2 F d 2 f 

- = / 2 —— 4 - 7 

dx 2+l dx dy 


dff 1 ay 

t 2 dy 2 


~=s 2 ^- 2 -^L , 2sd f d2p 


c) 


dt 2 
dF 


dx 2 


t 2 dx dy + t i dy 2 + t 3 dy ’ 


dsdt St dx 2 


d 2 f 1 d 2 f df _ l_ d£ 
t z dy 2+ dx t 2 dy 


_ 1 df Idf 
ds 2 dx + 2 dy ’ 


dF _ _ l df l df d 2 F 
3 ' 2 dx 2 dy ’ ds dt 


dt 


i ay iay 

4 dx 2 4 dy 2 


d 2 F _ 1 d 2 f 1 

A ^ 9 "I" Z 


ds 2 4 dx 2 


ay iay. 

2 dx dy 4 dy 2 ’ 


d 2 F 
dt 2 


1 ay 

4 dx 2 


i ay i ay 


2 dxdy +4 dy 


d 2 f 


d 2 cp d 2 f / ay 

s? - “ s “ 3? + cos ‘ '(w, + 37^; 

d 2 <p ay 

3730 = -r cos 0 sen© — + r cos 2 0 ^ 

df df 

-.«n #§ - + co SOX- 


+ sen 2 6 


d 2 / 

dy 2 ; 


ay 


— rsen 2 6 


d 2 f d 2 f 

^- x +r cosflsenflg^ 



Soluciones a los ejercicios 


7. a) 


'_dfdX dfdY dfdZ dF_dfdX dfdY dfdZ 

dx dr dy dr dz dr ’ ds dx ds dy ds dz ds 

' df dx dfdY dfdZ 
~TxU + d}JJ + dzTt 

d I- d Ul + , d l. d l- d l_, d ljl. d I- d l+.JU1 

dr dx dy dz ’ ds dx dy dz ’ dt dx dy dz 


dF 
8 - ds 


9. a) 


dF 

10 - aT 


11. a) 


13. a) 
b) 


14. a) 


d l = lr l d lJlJA- d Z = ,J d Ul_ d I\. d l = 7 t l d l _ d ljl\ 

dr la* dy dz) ’ ds \3* dy dz) ’ dt la* dy + dz) 

_dfdX dfdY dfdZ dF_dfSx dfdY dfdZ 

dx ds + dy ds dz ds ’ dt dx dt + dy dt dz dt 

dF df df df dF df df df 
ds ~ 2s dx +2s dy +2t dz ’ di ~ 2t d~x~ 2 ‘Ty +2s d~z 

d Z- d l JL . M . d UL_ d ±± d l 

ds dx dy dz ’ dt dx dy S dz 

_dfdX dfdY dF _dfdX dfdY dF _ dfdX dfdY 
dx dr dy dr ’ ds dx ds dy ds ’ dt dx dt dy dt 

dF df dF df dF df 
dr dx ’ ds dx ’ dt dy 

d zjl + 2 r d l. *ZJ±+ ■>'%• d -Z- d ±+, t d l 

dr dx dy ’ ds dx dy ’ dt dx dy 

dF_ 1 d£ ' df _ -rdf 1 df dF_-sdf 

dr s dx ’ ds s 2 dx + tdy’ dt t 2 dy 

f(x,y, z ) = xi + yj + zk, mas un vector constante cualquiera 

f(x,y, z) = P(x)i + Q(y)j + R(z)k, donde P, Q, R son tres funciones cualesquiera 
; satisfacen P' = p, Q' — q, R' = r 


1 df dF _ — rdf 10 f dF —s df 


*,y) = 


gX+2v 

2e x+2v 

1 Av 9 w 2 ~ 

2 cos (y + 2x) 


Dg(u, v, tv) = 

cos (y + 2x) 

-2 u 2 0 _ 


h(u, v, w) = e u+i iv a +3u,»-Hv-2n>i + sen (2t) _ „2 + 2 « + Av 2 + 6w 3 )j 


Dh(l, -1,1) = 


0 —6 cos 9 18 cos 9 


15. a) Df(x, y, z) = 


lx 1 1" 

2 1 2z 


Dg(u, v, w) = 


'v 2 w 2 2 uvw 2 2uv 2 w 

0 w 2 cos v 2w sen v 
2ue v u 2 e v 


0 
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Soluciones a los ejercicios 


b) h(u, v, w) = (u ! uV + w 2 senn + u 2 e v )i + (2 uv 2 w 2 + w 2 sen v + u*e 2v )j 


c) Dh(u, 0, tv) 


2u tv 2 + u 2 O' 
4 « 3 tv 2 + 2« 4 0 


8.24 

1 . 

2 . 

3. 


4. 

5. 


6 . 

7. 


10 . 

13. 

14. 


Ejercicios varios (pag. 342) 

Un ejemplo: f(x, y) = 3x cuando x = y , fix, y) = 0 para los demas valores de icj 
DJiO, 0) = 0 ; Z> 2 /(0, 0) = — 1; £> 21 /(0, 0) = 0 ; D 12 f( 0, 0) no existe 

a) Si a = (fli, a 2 )> entonces f'{0\ a) = a 2 /af si a x ^ 0, y f'(0; a) = 0 si a x = 0 

b) La funeion / no es continua en el origen 


a/ i 
J — 

3a: 2 


3/ 1 

j-=-e-^ r 


= - e-^x-My 1 /*; 


ay av ay 

F '" ( 0 = [A "(/)] 3 + 3 [XXOTYXO + 3 ^ 2 r'( f )[y'(i )] 2 

ay ay ay 

+ 9^3 (OP + 3 ^X\t)X"(t) + 3 ^ [*'(/) y'(/) + X\t)Y"(t)] 

ay a/- a/ - 

+ 3 ^ y'(or"(f) + Y x x '"(0 + Y y Y "'(0, 

suponiendo que las derivadas parciales mixtas no dependen del orden de derivacion 
8 

, dg df df dg df df d 2 g d 2 f d 2 f 

a) du~Tx V + Ty U ’ Tv = Tx U -iy V ' hkv = m d7 2 + ( "* “ ^ d7dy 
d 2 f df 

UV dy 2 dx ^ a ~ i > b — 

a) ?>'(/) = A\t)lf^f\A{f),y\ dy + B\t) “> /[at, S(r)] dx 

b) <p\t) = 2/e* 2 (2e‘ 2 — e* — e c ) 

Una esfera con centre en el origen y radio J2 

fix) = ;c 2 


Capitulo 9 

9.3 Ejercicios (pag. 349) 

1- fix, y) = sen (x - iy) 

2. f(x, y) — e x+5v/2 — 1 

3. a) u(x, y) = x 2 y 2 e xv 

b) v{x, y) = 2 + log - 



Soluciones a los ejercicios 
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5. A = B = C = 1, D = —3; f(x,y) = <f x (3x + y) + <p^x - j) 

6 . G(x, y) = x - y 


9.8 

1 . 

2 . 

3. 


4. 


5. 

6 . 
8 . 
9. 

10 . 

11 . 

12 . 


9.13 


Ejercicios (pag. 368) 


dX/dv = (1 +.xu)/(x - y) ;dY/du = (1 - v't’)/U - y) -,dY/dv = (1 + _y«)/(y - x) 

= -(1 + xu)/( 1 + u) ; dVjdu - (1 - jv)/(l + yu) ;dV/dy = (1 - x)/(l + «) 


9^ 

9t> 

r = 


d{F, G) 

/d{F, G) 

dY 

d(F, G) 

ld(F, G) 

dY 

_ d(F, G) / 

d(y, v) / 

d{x,y) ’ 

du = 

d{u, x) / 

d{x,y) ’ 

dv 

d(v, x) / 


i 

± V751 (24/ - 4 V 7 J + 3 \/7A ) 


g(/% G) 


2i +j + yjl k,o cualquier producto no nulo de este por un escalar 
dxjdu = 0 , dx/dv = w /12 
n —2 

df/dx = -l/( 2 y + 2 z + 1); df/dy = -2(y + z)/(2y + 2 z + 1) ; 
d 2 f/(dx dy) = 2j(2y +2z + l ) 3 

d 2 zj(dx dy) = [sen (x + _y) cos 2 (y + z) + sen (y + z ) cos 2 (x + j)]/cos 3 (y + z) 

df _ D X F + 2 xD 2 F df D X F + 2 yD z F 

dx ~ D X F + 2 zD 2 F ’ dy D X F + 2zD 2 F 

DiF =f'[x + g(y )); D 2 F =f'[x + g(y)]g'(y) ; D 1X F = f"[x + g(y )]; 
D vi F =f"l* +g(y)\g'(y ); W =/"[* +g(y)][g'(y)] 2 +f'[x +g(y))g"(y) 

Ejercicios (pag. 381) 


1. Minimo absoluto en (0, 1) 

2. Punto de ensilladura en (0, 1) 

3. Punta de ensilladura en (0, 0) 

4. Minimo absoluto en cada punto de la recta y = x + 1 

5. Punto de ensilladura en (1, 1) 

6 . Minimo absoluto en (1,0) 

7. Punto de ensilladura en (0, 0) 

8 . Punto de ensilladura en (0, 6 ) yen (x, 0), para todo x; minimo relativo en ( 0 , y), 
0 < y < 6 ; maximo relativo en (2, 3) y en (0, j) para y < 0 e y > 6 

9. Punto de ensilladura en (0,0); minimo relativo en ( 1 , 1 ) 

10. Puntos de ensilladura en (tin + 7 r/ 2 , 0), siendo n un entero 

11. Minimo absoluto en (0, 0); Punto de ensilladura en (-£, -|) 

12. Minimo absoluto en (-/a, -/g); maximo absoluto en (1,3) 

13. Maximo absoluto en (w/3, w/3); minimo absoluto en (2ir/3, 2w/3); maximo relativo en 

(w, it); minimo relativo en ( 0 , 0 ); punto de ensilladura en (0 w) y (tt 0 ) 

14. Puntos de ensilladura en ( 1 , 1 ) 

15. Maximo absoluto en cada punto de la circunferencia x 2 + y 2 = 1 ; minimo absoluto 
en ( 0 , 0 ) 
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Soluciones a los ejercicios 


17. c) Maximo relativo en (2,2); no existen mi'nimos relativos; puntos de ensilladura en 
(0,3), (3,0), y (3,3) 

18. Maximo relativo £ en (£, |) y (—£, —|); mi'nimo relativo — Jen(£, — j) y (— |,|); 
puntos de ensilladura en ( 0 , 0 ), (± 1 , 0 ), y ( 0 , ± 1 ); maximo absoluto len(l, — 1 ) y 
( — 1,1); mi'nimo absoluto —len(l,l) y ( — 1 , — 1 ) 

19. a) a = l, b = 

b) a — 6 log 2 — 3w/2, b = v — 3 log 2 


21. Sea ** = ~ n ^ x it y* = ^ ^y { , «< = x t - x* . Entonces a = /(2 "<) ’ 


i=l 

y b = y* — ax* 


22. Sea ** - “ 2*<’2* z*= - ^ z f! . «,=*,- x*, v t =y t - y *, 
1=1 

2 ^ 


y pongamos 


A = 


2 “* 2 " 


, considerandose las sumas para i = 1,2.«. Entonces 


c = z * — a x* — 6^* 


1 

2 “**' 

2 "*"* 

b- 1 

2 t,iZ< 

2 

A 

2 -* 

2 -< 

’ b ~ A 

2 m<z< 

2 “5 


25. Autovalores 4, 16, 16; mi'nimo relativo en (1, 1, 1) 


9.15 Ejercicios (pag. 387) 

1. El valor maximo es A; no tiene mi'nimo 

2. El maximo es 2; el mi'nimo es 1 

3. a) El maximo es ^ en (b(a 2 + b 2 )~ l/ ^, a(a 2 + b 2 )~'^) ; el mi'nimo es 

__ ab 

- ^ + 1,2 en (~b(a 2 + b 2 )~^, -a(a 2 + b 2 )~^) 
ab 

/ ab 2 a 2 b \ 

b) El mi'nimo es a 2 b 2 l(a 2 + b 2 ) en [^ 2^2 > ^rjTfcS*) ; no tiene maximo 

4 . El maximo es 1 + >/2/2 en los puntos (nn + ttJ 8 , tnr — tt/ 8 ), siendo « unentero cual- 
quiera; el mi'nimo es 1 — yj 2/2 en(/* 7 r 4- 57 r/ 8 , « 7 r -j- 37t/S), siendo /? cualquier entero 

5. El maximo es 3 en (i, —§,§); el mi'nimo es —3 en(—J, f, — f) 

6 . ( 0 , 0 , 1 ) y ( 0 , 0 , - 1 ) 

7. 1 



Soluciones a los ejercicios 


785 


8 . (1,0,0), (0, 1,0), (-1,0,0), (0, -1,0) 

a a b b c c / a b c \ 

(a + b + c ) n + b ic at \a + b + c’ a + b + c ’a + b + cj 

10. abcsj 3/2 

11. 5 log r + 3 log yj 3 

12 m 2 = a +C - yJ(A~- Cf + 4B 2 
2(AC - fl 2 ) 

13. (4 ± y/S)ly/2 

14. El angulo es tt/ 3; anchura del fondo c/ 3,e! area maxima es c 2 l(4y/ 3) 


Cupitulo 10 


10.5 

i Ejercicios (pag. 399) 




1. 

1 4 

8. 

5 


“15 

2 


2. 

—2-na 2 

9. 

369 
— 10 


3. 

i 

3 6" 

10. 

— 2 tt 


4. 

4 

3 

11. 

0 


5. 

0 

12. 

(a) 

-2y/2rr 

6. 

40 


(b) 

— TT 

7. 

2 3 

6 





10.9 

Ejercicios (pag. 403) 



1. 

2 3 

6 

8. 

256a 3 /15 

2. 

2a 3 

9. 

2A S (1 + 2tt 2 ) 

3. 

a = (3c/2)* 

10. 

[(2 + Z 2 ) 3 '* - 2 n /2]/3 

4. 

0 

12. 

momento de inercia= 4a 4 

5. 

8?r(sen& — cos 0) 

13. 

2tt/3 

6. 

mj 3 /4 

14. 

600 - 36^2 - 49 log (9 - 4^2) 

64(6^2 + log (3 + 2^2)] 

7. 

-n/2 

15. 

6ab 2 _ b-rrab 2 

X 3 a 2 + 4 t 7 2 6 2 ’ * " 3a 2 + 4 tt 2 6 2 

16. 

4 = (a 2 + b 2 )^[na 4 + (4rr 3 

- tt/ 2)a 2 b 2 + 32n s b 4 /5] 


4 = (a 2 + 0 2 )^[mj 4 + (4 tt 3 

+ 7r/2)a 2 6 2 + 32^ 4 /5] 
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Soluciones a los ejercicios 


10.13 Ejercicios (pag. 409) 

1. Todos excepto (/) son conexos 
6 . a) No conservative 

b) (2e 2n - 5e” - 5* - 3)/10 


10 . 4 b 2 — 8nb + 4 ; se presents el mi'nimo cuando b = n 


10.18 Ejercicios (pag. 420) 

1. <p(x,y) = |(x 2 +/) + C 

2. <p(x,y) = x 3 y + C 

3. <p(x, y) = x 2 e v + xy — y 2 + C 

4. <p(x, y) = x sen y + y cos x + ( x 2 + j 2 )/2 + C 

5. <p(x, y) = x sen (xy) + C 

6 . <p(x, y, z) = (x 2 + y 2 + z 2 )/2 + C 

7. <p(x, y, z) = x 2 /2 — y 2 /2 + xz — yz + C 

8 . f no es un gradiente 

9. / no es un gradiente 

10 . / no es un gradiente 

11. <p(x, y, z) — y 2 sen* + xz 3 - 4y + 2z + C 

12. <p(x,y, z) = x + 2x 2 y — x?z 2 +2y — z 3 + C 

ar n+1 

13. b) <p(x, y) = j-j + C si n -1 ; <p(x,y) = a log r + C si n = -1 


yP-\~ 2 

15. <p(x) = p + 2 + C si P - 2 ; 9>(x) = \ogr + C sip — —2 

16. <p(*) = <?(r) + C 


10.20 Ejercicios (pag. 425) 

1. x 2 /2 4- 2xy + y 2 l2 — C 

2. x 2 y = C 

3. x*/3 - xj - yl2 + (sen 2y)/4 = C 

4 . cos 2x sen 3 y = C 

5. x?y + 4x 2 y 2 - 12e* + 12 ye v = C 

6. 5 Q(x)el p(x) ** dx - yel p M«* = C 

8 . a) x + y = Cy 2 

b) fix 2 - 3 log |x| = C 

9. a) 6 (xy)'t — (yjx )** = C ; (xy~^ es un factor integrante 
b) x + e“*senj = C; e~ x cos y es un factor integrante 

10. X 3 / + x*f = C, lOx 3 / + xy = C , respectivamente; xy es un factor integrante 
comun 
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11.9 Ejercicios (pag. 442) 


1- i 
2 . 1 

3. 2^3 - 

4. **I4 

5. 2 

6. 2 rr 


Soluciones a los ejercicios 
Capitulo 11 


7. 6 

8. f~ 3 (e ia - e ‘) + r 2 - r 1 

10 . i 

ii- §(¥-72) 

12. w/2 

13. (log 2)/6 


5. - ^ 

6 . 6 

7 8 0 
'• 3 

8 - a) f b) 2 c ) 32077 


11 LLU + J^ dx ] d y d y 

14 - d y 

15 ‘ J -1 LLviIy^’ y> dx \ d y + I: [J^/ 1 —/(x, y ) dxj dy 

i6 - ^ 

w - d y + /:[ji:rv(^,)^] * 

,s - 

i9 - j:it*+**]*-♦ 

20. j = 0, J = AT tg c, X 2 + J 2 = a 2 , JC 2 + y* = A 2 

21 • a > Si[Sl^ X ’y )dx ] d y b ) 4e * + 2e/3 


11.15 Ejercicios (pag. 453) 

1. —3tt/2 

2. f + cos 1 + sen 1 - cos 2 - 2 sen 2 

3. e — e~ x 

4. £ log 2 

9 - 

10 - /« Ul*f (x 'y )d y] dx 
n - !l\Jlf ( *>y )dx ] d y 
12 • Jo LCl Vl ~* ^ ^ dx ] d y 
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Soluciones a los ejercicios 


22. m — 2; n = 1 


11.18 Ejercicios (pag. 461) 

1 . * = y = f 

2 . x = 1 , .y = 0 

•5 V — AS V — £0 
J. X — 13 , x — 39 

4. X = */ 2, j* — ir/8 

/ *,72 \ * *v/2 /- a/2 + 1 

5. x = (V2 + l)(—5--l) =2 +-J--1 - V2. 

2a 2 log a — a 2 + 1 _ a(log a ) 2 

6 ' * 4(aloga — a + 1) ’ ^ 2(aloga — a + 1) 

7. x = .y = | 

8 . x = y = 256/(315*) 

9. V - ¥ log 3 

10. x = | ||/151|, y = § ||/1D|| ;suponiendo que los ejes x e y coincidan con los lados AB y . 
respectivamente 


11 . 4 


5 TT 

12 ’ Iy 


2* 3 

T 


77 


12 . 4 = i46 3 (a - c), 4 = A 6 (a 3 - c 3 ) 

13. 4 = 4 = (1 - 5*/16)r 4 

14. 4 = 4 = f 

15. 4 = er((4a - l)e 4 ° - 1], 4 = [(« 3 - 3a 2 + 6a - 6)e 2 ° + 6] 

1 zr j _ 7_2 j _ 14 8 

A0 * 10 5 j ~ 45 

19. \h\_-Jl + log (1 + V2)] 

20 . A 2 + fr 2 

21. a) (¥, 1) 

b) a, f) 

c) (¥, ¥) 

d) (¥,¥) 

22. h = 2^/3 

23. A > r^2 


11.22 Ejercicios (pag. 471) 

1. a) —4 

b) 4 

c) 8 

d) 4* 

e) 3*/2 



Soluciones a los ejercicios 
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2 . 0 

3. n = 3 

4. — n 

9. g(x,y) = ±[P\x,y) + Q 2 (x,y)] A 

* 11.25 Ejercicios (peg. 478) 


1. 

b) 0 




2. 

0, 27r, —In 




3. 

A lo sumo tres 




4. 

A lo sumo siete 




5. 

a) -3 




6. 

In 




11.28 Ejercicios (pag. 488) 




1. 

Jo [Jo C0S 6 ’ r sen 6 ) r rfr ] dd 




2. 

r »/2 r r 2 cos a 




J _,/2 1_J 0 /(' cos 0, r sen 6)r drj dO 




3. 

/o [Jo cos r sen dO 




4. 

r »/2 r rm „ 




Jo |_J 0 /0 cos 0, r sen 8)r drj dO, 

donde 

g(6) = l/(cos 0 + sen 0) 

5. 

r W4 [" f tan e sec 0 -i 

Jo LJo / (r C0S 6 ’ r sen 0)r dr \ dd + 

CBvIi r resc o -i 

JW4 LJo ^ G ° S r Sen d > dr \ dd 





T rtanOaecO -t 



+ 

' 3jt/4 

LJo /( r cos r sen 0)r drj 

6. 

| na* 




7. 

Wlsll + log (1 + ^2)] 




8. 

y/2 - 1 




9. 

na*/8 




10. 

f »/4 r (“sec « -] 

Jo U 0 f(r cos 0, r sen 0)r drj dO + 

r*/2 

' ff/4 

r rose $ -i 

(_Jo f(r cos 0, r sen 0)r dr dO 

11. 

r»/3 r /*2 sec e ~i 

L Lf. /'«'•*] * 




12. 

V /<'• e > *] <K, 

donde 

g(0) = 1 /(cos 0 + sen 0) 

13. 

r»/« f r«ec« -1 




Jo LJtan » «c »/ (r COS e > ' Sen 0 > ^ 




14. 

ir4 /3 




15. 

a) u = 7x - y, v = —5x +y 

b) 60 
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17. 


Soluciones a los ejercicios 


a) 1+2 u 

c) V 

2 / 1 5 \ 

d) 2 H-arctan —t. — arctan —— | 

V3\ V 3 /3/ 

18. a) 4 (m 2 + y 2 ) 
c) 0 

19. [(/> 2 + r 2 ) 1 ~ p — /? 2<1 ~ p) ] si p # 1 ; 7T log (1 + r 2 ) si p — 1. 
I(p, r ) tiende a un li'mite finito cuando p > 1 


11.34 Ejercicios (pag. 504) 


1- ^ 4 

2 . log ^2 
3 - 1 - 

4 8 

4. ^nabc 

5. 7t/6 


5 

1 6 “ 


6 - Jo 1 (f [Jo Xf(x ’ y ’ z) dy \ dz + /» Uz-J (x ’ y> z) dy i dz 1 dx 

7 - !o{LU-v^ (x ’ y ' z)dy ] dx ) dz 

8 - £ If ll> * z) dy ] dz + ST Sv^? l f(x ’ y > z) dy i dz ) dx 


10. 16tt/3 

11 . | 

12. -i 0 -7ra 2 /!(3a 2 + 2A 2 ) 

13. tW* 

14. |t7(6 3 - a 3 ) 

15. f-Tri? 3 (a 2 + A 2 + c 2 )-« 

18. 177(5/5-4) 

19. - 2 

20. |tt(& 5 - a 5 ) 

22. En el eje , a una distancia % /t de la base 

23. En el eje , a una distancia % h de la base 

3 b* - a* 

24. En el eje de simetria a una distancia - • 77 -del piano secant e de los hemisferios 

8 b 6 — a* 


25. x. = y — z = J 2 I 1 (suponiendo el vertice citado en el origen) 

26. M {a 2 + Ah 2 ) 

27. f MR 2 

28. | Ma 2 

29. 2'-( 



Soluciones a los ejercicios 
Capitulo 12 
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12.4 

1 . 


2 . 

3. 

4. 

5. 

6 . 


7. 

8 . 
9. 

10 . 


Ejercicios (pag. 517) 

(a,b 3 - a 3 b 2 )(x - x a ) + (a^ - ajb 3 ){y - y 3 ) + (aj> 2 - a 2 bj)(z - z„) = 0 ; 

dr Sr 

dit * di> ^ ~ + (a ' jbl ~ aib ^ + ( ait>2 ~ a z b ^ k 

Sr Sr 

x 2 /a 2 + y 2 jb 2 = z ; — x — = — 2 bu 2 cos vi — 2au 2 sen vj 4 - abuk 

x 2 y 2 z 2 Sr Sr /sen u cos 

+ 15 + “5 = 1 5 — x — = a 6 c sen « - 

a 1 b 2 c 2 Su Sv \ a 

2 —f(\Jx 2 + y 2 ); — *x — = —«/'(«) cos vi — uf\u ) sen vj + 

/ z 2 Sr Sr 

-* + 75 = 1 ; — x — = b sen vj + a cos vk 
a 1 b‘ Su Sv 

(Jx 2 + y 2 - a) 2 + z 2 = b 2 ; 

Sr Sr 

— x — = b(a + b cos «)(cos u sen vi + cos u cos vj + sen uk) 

... , f /sen 2 u cos 2 u\ senh 2 tfl ' A 

\abc\ cosh v\ I I cosh 2 v + 

sjmv 2 + 4_ 

| u - v\ y/36u 2 v 2 + 9 (u + v) 2 + 4 
V « 4 + u 2 


v sen u sen v cos u \ 

-» + —-—j + —kj 


12.6 Ejercicios (pag. 524) 

2. Tta 2 ^! 3 

3. O - 4)a 2 

4. 4 

5. a) Un paraboloide de revolucion 

b) —2u 2 cos vi — 2 m 2 sen vj + uk 

c) n = 6 

6 . ^/2 v-a 2 /4 

7. 2^6 

8. 27ra\3 s ]3 - l)/3 

9. 4t7 2 <j6 

11. a) Un circulo unitario en el piano Ary; un semicirculo unitario en el piano xz, con 
z < 0 ; un semicirculo unitario en el piano x = y con z < 0 
b) La semiesfera x 2 + y 2 + z 2 = 1, z <, 0 
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Soluciones a los ejercicios 


c) La esfera x 2 + y 2 + z 2 = 1 excepto el Polo Norte; la li'nea que une el Polo 
Norte y (x,y, z) intercepta al piano xy en (u,v, 0) 


12.10 Ejercicios (pag. 532) 

1. 4ir/3 

3. x = y = z = a/2 

4. | 

7. 0 

8. 77^2 

9. En el eje del cono, a una distancia \a( 1 
esfera 

10. 7ra 8 A + fwa/2 3 

11. 3wa 3 /r + fn-aA 3 


12.13 Ejercicios (pag. 539) 

1 . 0 

2. — 7T 

12.15 Ejercicios (pag. 545) 

1. a) div F(x,y, z) — lx + 2y + 2z ; rot F(x,y, z) = 0 

b) div F(x,y, z) — 0 ; rot F(x,y, z ) = 2/ + 4j + 6k 

c) divF(x,j, z) = — xsen y; rot F(x,y,z) =i +j 

d) div F(x, y, z) = ye?- v — x sen (xy) — 2 xz sen (xz 2 ) ; 

rot F(jc, y, z) = z 2 sen (xz 2 )j — + _y sen 

e) div F(xr, j, z) = 2 jc sen y + 2y sen (xz) — xy sen z cos (cos z); 

rot F(x, y, z) = [x sen (cos z) - xy 2 cos (xz)]/ — y sen (cos z)j + [y 2 z cos (xz)~ 
x 2 cos y]k 

2 . 0 

4. « = -3 

5. No hay tal campo vectorial 

10. Un tal campo es fi(x, y, z) = ( xyz)~ 2 

11. div (V X r) — 0; rot (V x r) = (c + 1)F 

13. 16 (a+b) 

* 12.17 Ejercicios (pag. 551) 

1. (3x — 2 z)j — xk es un tal campo 

2 . (x 2 /2 — xy — yz + z 2 /2)y + (x 2 /2 — xz)k es un tal campo 

3. (x 2 yl2 + z 2 j2)j + Vf(x,y) para cualquier / independiente de z 

5. G(x,y, z) = ■ / Z g. ~ / - . ** satisface rot G = r~ 3 r para todos los puntos 
J r(x 2 + y 2 ) r(x 2 4- yv 
que no esten en el eje z 



— cos a)/[l — COS (a/2)] del centro de la 

12. 2n/3 

13. -tt/3 



Soluciones a los ejercicios 
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6 . f(r) = Cr~ 3 

9. F(x, y, z) = -i(z 3 i + x 3 / + fk), G{x, y, z) = i^(x 3 y + fz + z 3 x) 
10. c) 3tt/2 


12.21 Ejercicios (pag. 563) 


1. 3 


3. a) 

3 1 V\ 

2. a) 

14477 

b) 

9\V\z 

b) 

— 16w 

c) 

\V\x 

c) 

12877 

d) 

44 


15. 8rr 

Capitulo 13 

13.4 Ejercicios (pag. 575) 

2. A 1 \jA % vA 9 - (A x nA'n A') u (A t nA')uA 3 ; U A k = lj (A t n f 5 ) A J) u /(„ 



(i) 

00 

(iii) 

fc=1 

(iv) 

fc=l 

(V) 

(a) 

A' r\ B' 

A nB' 

A u B 

(A n B') u 04' n 5) 

i 

A’ ui' 

(b) 

500 

200 

500 

300 | 

800 


6 . i £ 2 ={ 0,^ 1 ,^ 2 ,^ 1 n /!',$} 

7. J’g ={ 0 ,^ 1 > ^ 2 > /l 3,^ 1 U/l 2 ,^ 2 u ^ 3 ,^ 1 <u A s 'u A 3 , A[, A’ 2> A 3 , A[ n A 3 , 

A' 3 nA' 3 ,A[ nA' 3 ,A[ n A' 2 nA' 3 ,S} (si/i > 3) 


13.7 Ejercicios (pag. 581) 

1. Ac B’ 

2. xeA'nB’nC' 

3. xeAnB’nC' 

4. x g ,4 u .B u C 

5. xe^ni'n C') u (/(' n B n C') u (/!' ni'nC) 

6. x e (/T n B') u (B' n c') u (^' n c') 

7. x6(^ni)u(^nC)u(inC) 

8 xe(^n£nC')u(^nB'nC)u(/njBnC) 

9. x e (.4 n B n C)' 

10. xG/ 4 n C n B' 

11. x g A n B n C 

12. xe^uiuC 

15. a) 1 - a 

b) 1 — b 

c) a + b — c 


d) 1 - c 

e) 1 — a + c 

f) a — c 
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Soluciones a los ejercicios 


13.9 Ejercicios (pag. 584) 


2. 

a) 

5 

14 

5. ^ 



b) 

45 

91 

6- -if 



c) 

1 0 

91 

7 3. 



d) 

36 

91 

8. a) 

AKA + B) 

3. 

a) 

23 

3 6 

b) 

B/(A + B) 


b) 

1 

6 

c) 

(C + 1 )/(C + D + 1) 


c) 

1 

3 

d) 

C/(C + Z) + 1) 


d) 

5 

36 

9. a) 

1 

9 


e) 

1 3 

3 6 

b) 

4 

9 


f) 

2 

3 

c) 

5 

9 

4. 

i 


d) 

8 

9 


I 9 

10. Fo = 1 - P(A) - P(B) + P(A n B), P x = P(A) + P(B) - 2P(A n B), 


12. a) 5 a 9 

b) 45 a 46 

c) 10 a 81 

d) 36 a 55 


P 2 = P(A n 


13.11 Ejercicios (pag. 591) 

1. {(1,2), (1,3), (2,1), (2, 3), (3,1), (3, 2)} 

2. 1326 

3. 54 

4. {H, T} x {H, T) x {1, 2, 3, 4, 5, 6} ; 24 resultados 

5. 52 !/(l 3 !) 4 

6. 36 

a) 18 

b) 12 

c) 24 

7. a) 13 • 12 • 11 ■ 72 = 123552 (no incluyendo trios o cuadruples) 

b) 5148 

c) 36 (no incluyendo 10JQKA) 

d) 4 



11. 16 
12. n k 



Soluciones a los ejercicios 
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13.14 Ejercicios (pag. 597) 

2. a) i»(/0=A; P(B\A) = *; P(A n B) = * 

4 _J)_ 

' /100\ _ /98\ 

\ 50/ \50/ 



9 . * 

15. a) P(A) = = />(C) =1; P(A n B) = P(A n C) = P(B n C) = i; 

P(A nB n C) = 0 


13.18 Ejercicios (pag. 608) 

1. a) P(H, H) = Pl p 2 ; P(H, T) = Pl (l - p 2 ) ■ P(T, H) = (1 - Pl ) Pt ; 
P(.T,T) = (l - Pl )(l -pj 

b) Si 

c) No 

d) H x y H 2 ,H x y T 2 ,H 2 y r 1# T x y J 2 

2 a'i - 3 -^£ 

Zr * a / 5 12 

k) 1024 

c) 6 


3. 

no 

\ 5 7 390625 

8. 

/n\ w k b n ~ k 

l 5 

/ 6 10 “ 2519424 

yfc/O*’ + b) n 

4. 

a) 


9. 

/ 8 \ 17 5 9938999 


b) 

i 

13/18 s “ 1377495072 


c) 

3 

1 6 


\ / 

5. 

a) 

(5!) 2 /10! = 2^2 

10. 

193 

5 12 


b) 


11. 

1 - (19/20) 10 = 0,4013 

6. 

a) 

36/> 10 - 80/> 9 + 45 p a 

12. 

193 


b) 

1^8 

5 12 

7. 

Es ventajoso apostar cantidades iguales de dinero 

14. 

59 < n <; 65 
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Soluciones a los ejercicios 


15. a) f(p) = (1 - pf + p 3 

b) (V31 - 4)/3 


13.20 Ejercicios (pag. 614) 

1 . a) /(*) = 2k 

b) f(k) = 3 k 

c ) /W = p k , donde p k es el fc-esimo primo >2 

d) una tal funcion es f(k) = (£-(£), /((it)), donde 


<?(*) = 


m 2 (k) + 3 m(k) 


-k+ 2 , h(k)=k~ 


m 2 (k) + m{k ) 


">(&) = 


'78* -7-1 


donde [x] representa el mayor entero <x 
e) /(*) = 2 9(i:) 3'‘ ( * :> , donde g(*) y h(k) son las definidas en (d) 

13.22 Ejercicios (pag. 617) 


1 . 

n 

= 0: 

max = 1, 

min 

-i 


n 

= 1 : 

max = J, 

mm 

= 0 


n 

= 2 : 

max. = i , 

mm 

= 0 


n 

= 3 : 

max = ^, 

mm 

= 0 


3. a) 1 — qp 3 — pq 3 


4. a) 3 pqKpq + 2) 

b) i 

c) 2 log 2 — 1 


13.23 Ejercicios variados sobre probabilidades (pag. 618) 


1- tV 

2 . a) A 

b) A 

3. a) i 
b) A 

4. a) \\ 

b) if 

c ) 16 % 
r 64 

5. 75 
7. 0.65 


8 . a) f 

b) I 

c) I 

d) No 

9. p 3 +e p (L-P^ 

10 . np( 1 - p) n ~ x + np n ~ x {\ - p) 



14.4 Ejercicios (pag. 625) 
1. b) X <, b 


Capitulo 14 
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Soluciones a los ejercicios 

2. a) {<o | X(w) e (a, b], I'M 6 (c, d]} 

c) X<,a, Y <,d 

d) P(a < X <, b, c < Y <,d) = P(X <, b, Y <, d) — P(X <, a, Y <, d) — P(X<, b, Y <, c) 
+ P(X < a, Y <, c) 

3. a) {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}, {(5, 6), (6, 5)}, {(1,6), (2, 5), (3, 4), (4, 3), 
5, 2), (6, 1), (5, 6), (6, 5)} 

b) P(Z = 7)=|; i>(Z = ll)=A; P(I = 7o I = ll)=| 

4. y = z x + z 2 +z 3 + z 4 ; p( y = o) = re; P(y = i)=i; / > (y^i)=A 

5. y = IX si 0 £ X <, 100 ; y = 10Z - 300 si Z > 100 

6. a) Z = Y - 1 

b) V = Y x + y 8 — 1 


14.8 Ejercicios (pig. 637) 


2. ; 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

Px(t) 

1 

1 3 6 

1 

1 8 

1 

1 2 

1 

9 

5 

3 6 

1 

6 

5 

3 6 

1 

9 

1 

1 2 

1 

1 8 

1 

3 6 


3. b) p(-2)=i, p(0) = p(2) = £ 

c) 1 , 0 , j,i 

5. a) c = £ 

b) 9, 3, 3, f 


c) 

F(t) = 

Opara; < 0, 

F{t) = 

ipara 0 ^ t < 

:l, F(;) = 

= Jparal < t < 2, 

F(;) 

= lpara 


t > 2 










d)No hay tal t 









e) 

t = 2 










6. a) 

k 

0 

1 

2 

3 

4 






P(k) 

16 

81 

32 

81 

2 S 7 

s 8 i 

1 

8 1 

pit) = 0 

para t ^ 0, 1, 2, 3, 

4 


b) 

Fit) = 

Opara; < 0, 

F(0 = 

en 

[0,1), 

F(;) = M 

en, [1,2), F(t) = 

8 ■> 

9 em 

[2, 3), 


F(t) = 

i~i en. [3, 4), 

F(f) = 

lpara; > 4 





c) 

8 £6 
2 7,81 










7. b) 

P(X = 

0) = 

(1 -pf 

; F(Z 

= 1) 

= 2/>(l 

-p) 





8- Px(k) — n ( n _j_ ^ < F x (t) — n ^ n _j_ ^ paraO <, t <, n, donde [f] es el mayor entero 
<,f, F x (t) = Oparaf < 0; F x (t) = lpara t > n 


9. p(k) = e- c k =0,1,2,3,... ; c>0 
/>(') = Opara; # 0, 1, 2, 3,. . . 

10. a) Px(0 = i en ; = — 1 y ; = +1 ; p x (0 = 0 para los demas valores 

F x (t) = Oparaf < -1 ; F x (t) = Jpara-1 < t < 1 ; F x it) = lpara; > 1 
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Soluciones a los ejercicios 


11. P(A) = }; P(B) = |; P ( AnB )=l; P(B\A)=\; P(A Ufi) = l 


14.12 Ejercicios (pag. 647) 

1. a) c = 1 ; f(t) = 1 si 0 t <, 1 ; fit) = 0 para los demas valores de f. 
b) 0,J,i 

2- c=J; F(/) = 0 si t < -tt/ 2 ; Fit) = £ cos / si - w /2 £ t < 0 ;F(t) = 1 - i cos t 
si 0 £ / < */2; F{t ) = 1 si t £ tt/2 

3. c = f ; F(f) = 0 si f<0; Fit) = J(3/® — r 3 ) si0 <, t <, 2 ; Fit) = 1 si t >2 

4. a) i 

b) i 

c) I 

5 ’ ^ fit) - 0 Si - ? f(t) ~ 8t ~ 1Si * * ' < * » /(0 = 7 - 8/si£ <;,<§; 

b) F(r) = 0si/ <*; F(l) = 4l a - /sii <£; F(t) = -4f 2 + 7r - 2 si 

<h Fit) = 1 si / ;> \ 

c) 1,1, £>0. A 

6- a) 0, |, $ 

b) f = 1 


7. a) * 

5 

10 

15 

20 

25 30 

F(X £ k) 

A 

e 

§ 

i 

i 

i 0 


b) Cada tren Styx llega 5 minutos antes que un tren Lethe 

8. F Y it) = 0si/ <6; F r it) = it -b)/asib ^ t <,b +a; F r (r) = 1 si t > b + a 

9. a) 37 

b) M 

c) If 

10. Fit) = - + - arctan -—- 

2 tt a 

14.16 Ejercicios (pig. 657) 

1. a) 105 

b) 10.05 

2. a) Kx /2 - 1) 

b) i(2-V2) 

c) i(2 — yj 2) 

d) *4 (4 — yj 2) 

3. a) 1 -e- 1 

b) e~ 2 

c) (e - l)/e 2 

d) e -3 

4. F(/) = 0 si t < c ; Fit) = 1 - g-^-c) si , ^ c 



Soluciones a los ejercicios 
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6 . A' = A/a , c' = b + ac 

9. a) 0,5000 

b) 0,1359 

c) 0,9974 

d) 0,0456 

10. a) 0,675 

b) 0,025 

11 . a) 0,67 5a 

b) 0,025<r 


12. a) 0,8185 

b) 0,8400 

13. 75,98 pulgadas 

14. media =6 , varianza =a 2 

15. F y (/) = 0 si / < 0 ; f Y {t) = 0 si t <, 0 ; f Y (t) = e- tl<l \s/2vt si t > 0 
14.18 Ejercicios (pag. 660) 

1 . a) F y (/) = 0 sir < 1 ; F Y (t) = (/ - l)/3 si 1 ^ t <, 4; F y (/) = 1 si t > 4; 

f Y (t) = ^ si 1 ^ / ^ 4 ; f Y {t) = 0 para los demas valores de t 

b) F Y (t) = 0 si / < —2 ; F y (/) = (/ + 2)/3 si -2 £ t <, 1 ; F r (f) = 1 si/ > 1 ; 

f Y (t) = £ si — 2 <, t <> 1 ; /VO) = 0 para los demas valores de t 

c ) F Y {t) = 0 si t < 0 ; F y (/) = t' A si 0 ^ t <, 1 ; F y (f) = 1 si / > 1 ; 

f Y (t ) = ( 2 ty-X si 0 ^ ^ 1 ; f Y (0 = 0 para los demas valores de t 

d) F y (/) = e ( sit <, 0 ; F y (/) = 1 si t > 0 ■J Y U)=e t ‘sit <, 0 ; f Y 0 ) = 0 si t > 0 

e) F Y (t) = e (/2 si t <, 0 ;F y (/)=l si / > 0 ;/ F 0) = ie </2 si / £ 0 ;/ F 0) = 0 si t > 0 

f) p Y (t) = 0 si t < 1 ;F y (/)=log/ si 1 <, e;F y (/)=l si / > e ; f Y (t) = 1 It si 

1 <, t <, e; f Y (t) = 0 para los demas valores de t 

2. Sea la funcion inversa de <p definida en intervalo abierto (a, b) 

Entonces F y 0) = 0 si / <, a ; F y 0) = F A -[y0)] si a < t < b ; F y (/) = 1 si t > b ; 
f Y (t)= si a < t < b; f Y (t) = 0 para los demas valores de t 

3. a) /V0) = 0 si / iS 0 ; /V0) = (2nt)-^e~ tri si / > 0 

b) / y (/) = 0 si / < 0 ; /V0) = 4/(27 r )- , ^e- tl/2 si t ^ 0 

C ) /V0) = 0 si / ^ 0 ; /V0) = ( 2 rr/ 2 )-'^-(iog«)V 2 si/ > 0 

d) /V0) = (2*r* sec 2 / e~< tan21,/2 si |/| < */2 ; / F 0) = 0 si |/| ;> */2 

14.22 Ejercicios (pag. 666) 

2. a) P(X = xJ =F(Ar = je 2 ) =F(E =F(r=j 2 ) = £(/> + 9 ) 

b) p =*q= \ 

3. a) F(jc,j) = sia y c<,y<,d, 

F(x,y) = si a <, x <, be y > d, F(x,y) = ^ - ~ — six > b y c < y < d, 
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F(x, y) <= 1 si jc > 6 e y > d, F(x,y) = 0 para los demas valores de x e y 

b) F x (x) = (x — a)/(b — a) si a <, x < b ; F x {x)= 0 si x< a; F x (x)= 1 si x<b ; 
F Y (y) = O' — c)/(d — c) sic < y ^ d; F r (y) = 0 si y < c ; F y (y) =1 si y < d 

c) X s Y son independientes 

5. P(Y = 0)=4; P(Y = 1) =P(Y = 2) = J 

7- hi 

8 . | 

9. b) /(x,_y) = | si (x,y)eQ; /(x, y) = 0 si (x, y) $ Q ; 

/x-(*) = 1 - |*| si |*| ^ 1 ; f x (x) = 0 si |*| > 1 ; 
fr(y) = i - \y\ si \y\ < l; f Y (y) = o si \y\ > 1 . 

X e Y no son independientes 
10 . g(u, v ) =/(« + a, v + 6) 

14.24 Ejercicios (pag. 673) 

1. b) f r (v) = 1 + n si — 1 ^ t> < 0 ; f v (v) = 1 - t; siO <, v <, 1 ; f v {v) = 0 si |u| > 1 
c) U y V no son independientes 

2 ; b) fy(j) = 2 — 2 /siO^/^l; fy(t ) = 0 para los demas valores de t 
c) U y V son independientes 

3. b) g(u, v) — ue~ u si u > 0,0<n<l ; g(u, v) — 0 para los demas valores de u y v 

c) fu (u) = ue~ u si u > 0 ; fjj(u) = 0 si u <, 0 

d) fy(v) — IsiO <t) <1; fy(v) = 0 para los demas valores de v 

4. b) g(u, v) = (o/2n-)e _,1+ “ ,)uS/2 si v ^ 0 
c) f v (u) = Ml + a 2 )]" 1 

5- fz«) = 

6 . b) f v (u) = 0 si u < 0 ; f v (u) = («/<r 2 ) exp ^ ^ j si u > 0 ; F v (t ) = 0 si t < 0 ; 

F v (t) = 1 - exp ^ ^ si / £ 0 

14.27 Ejercicios (pag. 681) 

1. E(X) = 1, Var (X) = ~ 

7. a) E(X) = Var (Af) = A 

b) No 

c) E(X) = 1/A, Var (X) = 1/A 2 

d) E(X) = m, Var (X) = a 2 

8 . a) C(r) = (r - l)/2 

b) F x {f) = 4 111 1 -*- si t < -1 ; F x (t) = 4 si -1 £ t <, 1 ;F x (t) = 1 - 41 1 -' sif>l 

c) P{X < 5) = 1 - 5 r-1 /2 ; P(5 <X < 10) = (5 1 -' - 10 1 - r )/2 

d) X tiene esperanza finita cuando r > 2 ; E(X) = 0 

e) Varianza finita para r > 3 ; Var (AT) = (r — 1 )/(r — 3) 

9. £(AT) = E(Y) = ; E(Z) = -1767/50653 ; E(X 4- Y + Z) = -4505/50653 

10. E/Af) -► oo cuando n -» ao 

12 . a) ( 2 /tt)^ 

b) e 1 '* 



c) e 2 — e 

d) (w/2)* 
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14.31 Ejercicios (pag. 691) 

4. 251 

5. 0 

6 . La desigualdad de Chebyshev da %; las tablas dan 0,0027 

8 . b) 0,6826 

9. b) 0,0796 

10. a) 0,0090 

b) 0,0179 


Capitulo 15 

15.5 Ejercicios (pag. 703) 


a) 

No 

3. a) 

Ni lo uno ni lo otro 

b) 

Si 

b) 

Seminorma 

c) 

Si 

c) 

Seminorma 

d) 

No 

d) 

Ni lo uno ni lo otro 

e) 

Si 

e) 

Seminorma 

f) 

No 

0 

Norma 

g) 

Si 

g) 

Ni lo uno ni lo otro 



h) 

Ni lo uno ni lo otro 


6. a), b), c) 

8. b) El polinomio dea) mas 1(5x 3 — 3x) Jlj (5t 3 — 3 t)f(t)dt + -j-§-j(35x 4 — 3Ox 2 + 3 

x Jij (35t 4 - 30t 2 + 3)/(t) dt 

9. a = — 3e/4 + 33/(4e), b = 3/e, c = x He - lie) 

10. i¥s(l 4- 14x 2 - 7x 4 ) 

11. b) 11/ - i’ll 2 = h 


12 . a) ||P -/|| 2 = 


log 2 n 
n - 1 


13 


l 12 6 (n + 1 ) \ 


4(n 3 — 1) log n 6 (n + 1) 

(« - l) 4 (n - l) 2 ’ 

||P _/||* = 36 log 2-28 log 2 2 - - 2 / = 0,0007 cuand'o n = 2 

a) ||P -/|| 2 = ^ K* “ 2)e 2n + 4e n - n - 2] 

b) P(x) = (18 - 6 e)x + 4e - 10; ||P -/|| 2 = 20e - l e 2 - // = 0,0038 

k 12k + 3 


14. b) 9 >* + 1 (x) = 

PJWPJ 


V(2 k + 1 )( 2 * + 3) 


k + 1 


x<p k (x) 


k + 1 V 2k - 1 


^t-lW, dondc % 
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15. 


Soluciones a los ejercicios 

m 


b) y P\{X) = \P m (x)P' m+1 {x) - P m+y {x)P m {x)} 

Pm+l 


15.9 Ejercicios (pag. 713) 

1. a) P(x) = i(x 2 + 13x + 12) 

b) P(x) = - 5x + 6) 

c) P(x) = -|(x 3 - 6x 2 + 5x - 6) 

d) P(x) = 2x 3 + x 2 - x - 2 

e) P(x) = -5a: 3 - x 2 + IOx - 5 

2. P(x) = T i ff (9x 4 - 196* 2 + 640) 

4. a) Q(x) — lx 3 + 3x 2 — * — 3 

b) Q( x ) = 4x 3 + 7* 2 - 3* - 7 

5. a) P(32)=fi; /(32) - P(32) = || 

b) P(32) =-||§; /(32) — P(32) = 

c) P(32) = ±|; /(32) - P(32) = -ii 

d) P(32) - /(32) - P(32) = ^t 

7. a) L 0 (*) = ^(u - 1)(« - 3 )(u - 4)(« - 6) ; L x (*) = —~ s u(u - 3)(« - 4)(« - 6); 

L 2 (x) = r W u(u - 1)(m - 4)(« - 6); L 3 (x) = -^u(u - l)(u - 3)(« - 6); 

4.W = Tio“(« - D(« “ 3)(« - 4) 

b) P(2.6) = 20 

8. b) * ^ 1,581 

c) h <, 0,0006 

12 . a) a = 0, b = 1 

b) c = 1, </ - -2L' k (x k ) 

13. d) Sean B 0 (x) = 1 y B n (x) — (x — x 0 )(x — x 0 — n/i)" _1 /n!para« > 1 ;el unico poli- 

nomio P de grado < n que satisface las condiciones P(x 0 ) = c 0 , P'(*i) = c lt 
P"(x z ) = c 2 ,.. . , P in) (x n ) = c„ viene dado por P(x) = c 0 £ 0 (x) + • • • + c n B n (x ) 

16. * 


15.13 Ejercicios (pag. 721) 


8 

-5040 

13068 

-13132 

6769 

-1960 

322 

-28 

1 



9 

40320 

-109584 

118124 

-67284 

22449 

-4536 

546 

-36 

1 


10 

-3628800 

1026576 

-1172700 

723680 

-269325 

63273 

-9450 

870 

-45 

1 


c) 1 + 2x + 2x 2 — 3X 3 + x 4 


8 

1 

127 

966 

1701 

1050 

266 

28 

1 



9 

1 

255 

3025 

7770 

6951 

2646 

462 

36 

1 


10 

1 

511 

9330 

34105 

42525 

22827 

5880 

750 

45 

1 
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Soluciones a los ejercicios 
d) -1 + 6* (1 > + 16x< 2 > + 9 jc< 3 > + x< 4 > 

7. a) *n 3 + -\l n 2 + - B ~n 

b) in* + In 3 + §n 2 + ~n 

c) in* + + -“« 2 + |n 

d) + ±n* + J -« 3 - 3 V 


15.18 Ejercicios (pag. 730) 

2. b) 7y,(l) = n 2 , r;(-l) - (-l)"-w 
1 — 

5. sen fl sen nfl =- T^(x) ; grado = n + 1 


7. GW = * n+1 - 2~ n T n+1 (x) 

8 . GW = -fx* + 3 lx 3 - §f* 2 + ^ g x - 

14. b) U 0 (x) = 1, U x W = 2x, t/ 2 W = 4x 2 -1, U 3 (x) =8^ -4x, 

W = 16* 4 - 12jc 2 + 1, t/ 5 W = 32.x: 5 - 32x 3 + 6x 


15.21 Ejercicios (pag. 742) 


1. 


2 . 


3. 


a) 

b) 

a) 

b) 

a) 

b) 


0,693773 - c, donde 0,000208 < c < 0,001667. De esto resultan las 
desigualdades 0,6921 < log 2 < 0,6936 
n = 578 


c = V3/3 

, a +Z> | b ~ a yl~* 

c = V2/2 

a + 6 6 — a ^/2 

c i — —^— H-;-r- 


a + 6 b — a y/3 

2 2 T 

a + 6 b — a yjl 

~2 2 2 “ 


4. a =2 + ^2, b=2-j2 

5. c = Vf 



10. a) log 2 = 0,693254 - <r, donde 0,000016 < e < 0,000521 ; esto nos da las 

desigualdades 0,69273 < log 2 < 0,69324 
b) log 2 = 0,69315023 - «, donde 0,00000041 £ e < 0,00001334 ; esto nos 
conduce a las desigualdades 0,693136 <log2 < 0,693149 

11. d) log 2 = 0,693750 e , donde 0,000115 < c < 0,003704; esto nos conduce a las 

desigualdades 0,69004 < log 2 < 0,69364 
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